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PRÉFACE 


La théorie du contrôle automatique est devenue de nos jours une 
discipline très vaste, ses résultats présentant un grand intérêt théori- 
que et pratique. Actuellement l'étude de cette branche scientifique 
s'impose non seulement aux spécialistes, mais encore aux étudiants 
de nombreuses spécialités. L'ouvrage que nous proposons au lecteur 
est un cours professé par l’auteur aux étudiants en Mécanique de 
la faculté de Mécanique et des Mathématiques de l’Université de 
Moscou. 

En guidant ses lecteurs depuis les notions initiales de la théorie 
de la commande jusqu'aux problèmes actuels, l’auteur a tenu égale- 
ment à rendre évidente la liaison qui existe entre les problèmes et 
les méthodes de la théorie de la commande du mouvement d'une 
part et les principes généraux de la mécanique analytique de l’autre. 

Il nous paraît inutile de donnericiun énoncé sommaire de nombreux 
problèmes de la théorie de la commande moderne. L'auteur a pris 
à tâche de traiter avec force détails et le plus rigoureusement possible 
une série de problèmes actuels de cette théorie. De plus, les problèmes 
exposés dans ce livre, et qui présentent un intérêt particulier, peuvent 
servir de base à l’étude ultérieure des monographies et des articles 
consacrés aux divers aspects particuliers de cette théorie et notam- 
ment, aux problèmes de commande des systèmes à paramètres 
répartis, de la théorie de poursuite, de stabilisation optimale, d'adap- 
tation, etc. 

L'auteur tient à exprimer sa profonde reconnaissance à Nikoluaï 
Krassovski de l’Académie des Sciences de l’'U.R.S.S. qui a révise 
le manuscrit et a fait des remarques précieuses qui ont beaucoup 
contribué à améliorer le présent ouvrage. 

La traduction française de cet ouvrage contient quelques complé- 
ments inexistants dans l'édition russe. L'auteur a remanié tout 
particulièrement le chapitre six relatif à la théorie des systèmes 
stochastiques. Les paragraphes ajoutés ($$ 27, 29, 31, 32, 33 et 34) 
portent sur les problèmes de filtrage optimal des processus aléa- 
toires multidimensionnels et les problèmes de commande optimale 
des systèmes stochastiques. 


CHAPITRE PREMIER 


SYSTÈMES COMMANDÉS LINÉAIRES 


$ 1. Systèmes commandés monovariables 


1. Systèmes à un degré de liberté. L'équation du mouvement 
d'un ES à un degré de liberté, os l'énergie cinétique est 


T = + Lrx, l'énergie potentielle V — + k.x* et la force non con- 
servative supplémentaire Q = —_k,x + z(t), s'écrira 
koz + kit + kot = 2 (1). (1.1) 


En désignant par D l'opérateur de différentiation par rapport au 
temps 


d 
D=——, (1.2) 
on peut récrire l'équation (1) sous la forme: 
(AD° + k,D + ks) z = 2 (1) (1.3) 
ou 
| 
TE DEEE D + de 2 U)- (1.4) 
La fonction 
1 
MATE TE di 


est une fonction rationnelle de l'opérateur de différentiation D, 
qui s'appelle fonction de transfert du système. 


Fig. 1.1 


En portant l'expression (5) dans (4), on obtient 
z = O (D)z (1). (1.6) 
La relation (6) est équivalente à l'équation différentielle initiale (1). 
Cette relation correspond au diagramme fonctionnel de la figure 1.1. 


La fonction z (t) est dite signal d'entrée, et la fonction z (t), 
signal de sortie du système. 
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Cherchons la solution de l'équation différentielle (1). Si 


k! = 4koke < 0, (1.7) 
les racines de l’équation caractéristique 
RAA + kXÀ + k, = 0 (1.8) 
sont 
Ms Àe = —8 +H io, (1.9) 
où 
__k Ca | 
Ex ? OU) = BE" (1.10) 


Sous la condition (7), la solution de (1) s’écrira 
z(t)= 2x (to) e-%t-to) cos © (t — to) + 


+ 12 (60) + ex (bo) ee to) sin © (4 — 40) + 


t 
+ _ e-t{t-Tsinw({—t)z(t)dr. (1.11) 
to 
Lorsque les conditions initiales sont nulles, c'est-à-dire si 
z(t) =0, z(to) = 0, (1.12) 


la loi du mouvement du système considéré sera 
t 
(= | —— e%t-9 sin w ({— +) z (x) dr. (1.13) 
{0 : 
Désignons par X (t) la fonction suivante 


1 
kow 


k(t)= 


et sin &f (> 0). (1.14) 


Cette fonction s'appelle fonction de poids du système (1). Il résulte 
de l’expression (11) que Æ(t — ft.) est la loi du mouvement du sys- 
tème pour 


z(t) =0, 
tandis que les conditions initiales sont 
e ‘| Ê 
z (to) =0, z(b)= +. (1.19) 


D'après l'expression (11) on peut conclure que k (£ — {,) sera égale- 
ment la loi du mouvement du système dans le cas où 


z(to) =0, xt) =0, z(t) =8(t— to), (1.16) 
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où 6 ({) est une fonction impulsion (fonction delta de Dirac). Pour 
cette raison la fonction k (t) est dite également fonction de transition 
impulsionnelle du système. 

Des relations (16) il suit que jusqu’à l'instant { = to, i.e. jusqu'à 
l'instant de l'application de l'impulsion unitaire, le système se 
trouvait en équilibre. Il en résulte que nous devons poser k ({ — to)— 
— 0 pour £{ << #9, c'est-à-dire que la fonction de poids est nulle lors- 
que la variable est négative. 

Ainsi l'expression (14) qui définit la fonction de poids k (t) doit 
être complétée par la relation 


k (t) = O0 pour {<< 0. (1.17) 
Conformément à (14) l'expression (13) pourra s’écrire 
Î 
z(t)= | k(i—T)z (0) dr. (1.18) 
Lo 


L'expression (18) peut être transformée en posant 
E=t—T. (1.19) 
Si l'on retient que £ est ici un paramètre, on aura dé — —dr. 
Puisque E — 0 pour t—tet E —1—1, pour t = t,, on obtient 
t— lo 
r()= | kCE)2U—E) dE. (1.20) 
0 
De cette façon le système où 
z (to) =0, z(t) = 0, 
a pour loi du mouvement 
t t- to 
z(t)— | k(I—T)2(r) dr = | k(E) z(1—E) dE. (1.21) 
to 0 
Considérons maintenant un cas limite. Soit 
lo — —O0, 
ce qui traduit le fait que l'application du signal d'entrée a eu lieu 
il y a un temps infini. Si e >> O0, c’est-à-dire si les oscillations libres 
du système (1) s’amortissent asymptotiquement, l'expression (11) 


devient 
{ t—to 


Fete JEU T)z(r)dr= lim | k(E)z(4—E) dE, 
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ce qui pour raison de simplicité s’écrira sous la forme abrégée 
{ 00 
z (é)= fet—rs(mar= |K(E)2(—E) dE. (1.22) 
— 00 0 


L'expression (22) traduit le processus s{ationnaire du système. 


E xemple. Trouvons à titre d'exemple le processus stationnaire du sys 
tème décrit par l'équation différentielle (1) 


koz + Hz + kez = 2 (1) 
pour le cas où 
2 (1) = kem = const. 
D'après (22) et (14) 


t—to 
lim z(t)= lim | k(E)z(t—E£) dë 
Lo — © to —+ — 00 
0. 
ou 
L t—to 
lim z(t)= 27 lim Ÿ «-*#sin ut = 
FRERE (£) ko® 0 À 5 dé 
_ kom Li eee (NE 
kow to-> — © e* + o* 0 


Etant donné que d'après (10) e > 0, eut , l'expression obtenue aura 
pour la forme 
lim z(t)=m. 
to —2 

2. Fonction de poids et fonction de transfert. Un système décrit 
par les équations différentielles linéaires à coefficients constants 
est dit système stationnaire. Pour un tel système la transformation 
de Laplace permet d'établir une correspondance assez intéressante 
entre la fonction de transfert et la fonction de poids. 

Rappelons [90] qu’on appelle transformée de Laplace de la 
fonction zx (ft) d’une variable réelle # la fonction d’une variable com- 
plexe p définie par la relation 


£L[z(b)] = | z(t) et dt. (1.23) 
0 
Dans le calcul opérationnel de Carson-Heaviside, la transformée E (p) 
de la fonction x (ét) est définie par la relation 


& (P) _. -pt , 
l =} dt, (1.24) 
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ce qui, en principe, ne diffère en-rien de la transformation de Laplace 
mais présente un avantage tel que la fonction z ({) = c, où c = const, 
a pour transformée la même constante: E (p) = c. La conformité 
opérationnelle entre les fonctions E (p) et z(t) (la fonction zx (+) 
s'appelle original) se note 


&(p) æz(t) ou z(t) < E (p). (1.25) 


Si l'on connaît la fonction E (p), l'original qui lui correspond 
est déterminé par la formule de Riemann-Mellin 


z (= 1 { CL et dp (t> 0), (1.26) 


où l'intégration s'opère dans le plan de la variable complexe p le 
long de la droite parallèle à l’axe imaginaire et distante de ce dernier 
de c. Cette droite se situe à droite de tous les points singuliers de la 
fonction E (p)/p. 

Considérons maintenant pour le système (1) étudie ci-dessus la 
fonction ® (p) de la variable complexe p, ladite fonction étant obte- 
nue à partir de la fonction de transfert ® (D) si l’on y remplace D 
par p. D'après (5) la fonction ® (p) sera de la forme: 


1 
ARTE TE T"É a 


En tenant compte des relations (7), (8) et (9), l'expression (27) peut 
s'écrire 


_ 1 A 9 
DP)= Gr -ovrere) Here pes" (28) 
D'après (28) 


PO (D) = Taie: (1.29) : 
Ainsi que l’on connaît [17], 


pw 


Fe + — e7tt sin wé. 


De cette façon, 


PO (p) et sin o/, (1.30) 
par conséquent, en vertu de (14), on aboutit à la relation 
pO (p) = k (+). (1.31) 


C'est précisément la relation entre la fonction de transfert © (D) 
et la fonction de poids k (t) du système (1) qui nous intéresse. 
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. Nous allons montrer dans ce qui suit que la relation (31) a lieu 
pour tout système linéaire stationnaire à nombre fini de degrés de 
liberté. 

La fonction de transfert ® (D) ou la fonction de poids # (4) 
qui lui correspond représentent la caractéristique dynamique princi- 
pale d’un tel système. Ces fonctions caractérisent aussi bien les 
oscillations propres du système que sa capacité de reproduire les 
signaux extérieurs. Les fonctions ® (D) et k(t) sont absolument 
équivalentes. 

3. Lieu de transfert. Notons encore qu’en vertu de la formule (26) 
de Riemann-Mellin 

; cH 100 
k (= | O(p)ertdp (1>0). (1.32) 


c—1ico 


Comme le montrent (28) et (11), dans un système où tous les pôles 
de la fonction © (p) sont situés à gauche de l’axe imaginaire, les 
oscillations libres s’amortissent asymptotiquement. En calculant 
pour un tel système l'intégrale (32) on peut poser c = 0. 

Les relations (31) et (24) entraînent que si l’on connaît la fonction 
de poids k (t) du système la fonction ® (p) peut être définie par la 
formule 


D(p)= fx (t)ePt dt. (1.33) 
0 


En posant p — iw et en tenant compte que k (t) = 0 pour t << 0, 
dans le cas d’un système tel que les pôles de la fonction ® (p) sont 
situés à gauche de l’axe imaginaire, on peut écrire la transformée 
de Fourier pour la fonction de poids k (t) sous la forme 


D (iw) = | k(t)e-iut dt. (1.34) 


—©œ 


La fonction © (iw) s'appelle lieu de transfert ou caractéristique fré- 
quentielle du système. 

Dans un système pour lequel les pôles de la fonction © (p) ne 
se trouvent pas tous à gauche de l’axe imaginaire, l’amortissement 
asymptotique des oscillations libres n’a pas lieu et la formule (34) 
ne peut pas servir pour déterminer le lieu de transfert! ® (iw) du 
fait que pour un tel système l'intégrale impropre 


IRLTOIC 


est divergente. 
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4. Système commandé en boucle fermée. La figure 1.2 représente 
le diagramme fonctionnel d’un système asservi dont le signal de 
sortie est x. Le signal d'entrée du système est une fonction du temps 


Fig. 1.2 


z (t) inconnue à l'avance. Le système est destiné à maintenir à tout 
instant { la valeur x ({) du signal de sortie à un niveau assez proche 
de celui du signal d’entrée z (t), en rendant ainsi suffisamment petit 
l'écart 
E —=Z—7Z 

du système asservi. 

La construction du système asservi, conforme au diagramme 
fonctionnel de la figure 1.2, peut être différente. Par exemple 
(fig. 1.3), on peut concevoir un arbre posé sur des paliers (dit arbre 


xl ) Organe de mesure 


E=z TL 
| 
we — —) Y 
Z(1) | 
Arriplifi - 
fi + ee, e 
| 
| 
EE AE ________] 
Fig. 1.3 


d'asservissement), dont le centre de gravité se situe sur l'axe de 
rotation. L'arbre d'asservissement est entraîné en rotation par un 
moteur électrique à courant continu et à excitation séparée (servo- 
moteur). La tension appliquée au circuit de l’induit est proportion- 
nelle à l'écart de l'asservissement. Dans notre exemple, x est 
l'angle de rotation de l'arbre d'asservissement, et z (4), l'angle 
de rotation d'un certain disque de commande dont le mouvement 
doit être reproduit par l’arbre d’asservissement. 
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Le diagramme fonctionnel de la figure 1.2 représente un système 
commandé en boucle fermée. Les équations du mouvement du système 
asservi envisagé peuvent s’écrire 


(koD* + k,D) x == ke, | 


E—=Z—Z, 


(1.35) 


où z —z(t) est le signal d'entrée du système. La première équa- 
tion (35) est celle du mouvement de l'arbre d’asservissement. La 
deuxième équation (35) définit la valeur de l'écart. En introduisant 
les notations 

ko 


W(D)= ET: (1.36) 


on peut représenter le système (35) sous la forme 
z=W(D)(z— 72) 


ou 
[4 + W(D)]z = W (D) z. (1.37) 
Avec les notations 
W (D 
O(D) = (1.38) 


l'équation (37) deviendra | 
| | z = D (D)z (t). (1.39) 


L'équation (39) s'appelle équation du système en boucle 
fermée. La fonction @ (D) est dite fonction de transfert du système 


4 — x) 


Fig. 1.4 


en boucle fermée. Le diagramme de la figure 1.2 est ainsi ramené 
a la forme (fig. 1.4) étudiée au point 1. 
Pour le sy$tème asservi considéré, la fonction ® (D) d’après (36) 
et (38) a pour expression 
ka 
POS RDEERDEE 
et l'équation (39) est équivalente à l'équation différentielle 
(koD° + AD + ke) z = ka z (+). (1.41) 
5. Système commandé en boucle ouverte. Supposons maintenant 
que dans un système asservi la chaîne de réaction soit ouverte (fig. 1.5). 
La tension appliquée au circuit de l'’induit est cette fois pro- 
portionnelle non pas à l'ecart nrais au signal d’entrée z (t). Le dia- 


(1.40) 
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gramme fonctionnel du système-asservi de ce type, dit système com- 
mandé en boucle ouverte, est donné par la figure 1.5. 

D'après (35) les équations du mouvement du système asservi 
auront dans ce cas pour expres- 
sion 
(koD? + k,D) x = k, z (t). (1.42) 

D'après (36) l'équation (42) 
peut être ramenée à la forme 

z—=W(D)z(t). (1.43) 


L'équation (43) est dite équa- 
tion d’un système en boucle | 
ouverte, la fonction W (D) étant Fig. 1.5 
sa fonction de transfert. 

L'expression (38) obtenue ci-dessus 

mn _ W(D) 
VOI= TE w 5 
établit la relation entre les fonctions de transfert des systèmes”en 
boucle fermée et en boucle ouverte. 
6. Reproduction du signal d'entrée converti. Si le système de 


* 


commande consiste à reproduire non pas le signal d’entrée z () 


Fig. 1.6 


lui-même mais son signal converti }H (D}z(t)}, H (D) étant une 
fonction rationnelle de l'opérateur de différentiation D, on peut le 
réaliser en insérant dans la boucle de retour un dispositif dont la 
fonction de transfert est À (D), où 


Î 
On obtient ainsi le diagramme de la figure 1.6. Le signal de l'écart est 
C—=z—h(D)7x. (1.45) 


Les équations du système en boucle fermée seront 
(koD* + k,D) z = KG, | 


t=2—h(D)z. (1-46) 
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D'après la relation (36), nous récrivons ces équations sous la forme 
z=W(D)[z—h(D)7zxl 


ou 
A +W(D)h(D)]z = W (D) 2 (t). (1.47) 
La fonction de transfert du système en boucle fermée s’écrira alors 
_ W (D) 
FOD)=p5 © : (1.48) 


En vertu de (48), l'équation (47) devient: 
z = W (D)z(+t). (1.49) 


Le système de commande en boucle ouverte est représenté sur la 


Fig. 1.7 


figure 1.7. Les équations de ce système s'écriront 


z=W(D)z(t), 

Sd —h{D}= (1.50) 
d'où 

o = h(D) W (D) z (t). (1.51) 


De cette façon la fonction de transfert du système en boucle ouverte 
est de la forme 


S(D)=h(D) W (D). (1.52) 


» 


7. Système monovariable à nombre fini de degrés de liberté. 
Parmi les systèmes de commande, le système à un degré de 
liberté examiné précédemment est le plus simple. De nombreux 
systèmes possèdent plusieurs degrés de liberté. Un système qui 
a pour tâche d'assurer que la loi de variation dans le temps 
seulement d’une seule des coordonnées qg; = q; (t) de ce système soit 
proche d'une certaine fonction du temps z(f) (en général, incon- 
nue à l'avance), la loi de variation des autres coordonnées géné- 
ralisées q;(t) (i = 1, 2, ...; ij) n'étant pas soumise à ces 
contraintes, est dit monovariable (à une variable). 
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Son mouvement est gouverné par les équations suivantes 


de = À Auugn + me [2 (E) — 95] (s—1,...,n). (1.53) 


Le système des équations différentielles scalaires (53) est équivalent 
à l'équation différentielle vectorielle 


g = Ag + m [2 (ë) — gl, (1.54) 
où q, À et m désignent les matrices 
= mn” 
.. | (1.55) 
Mn 


qi. Ai -.. Ain 
g—=| --: |, Al ........ ; m = 
An _ _ An: Dr 
L'équation (54) peut être mise sous la forme 
d 
(ED—4)g=m{z()—g] (D=<), (1.56) 
où E est la matrice unité. Il en résulte 
je B(D)mIz(t)—g;)] 


D (1.57) 


où B (D) est la matrice adjointe de la matrice ED — À, et f (D), 
le déterminant de cette dernière: 


f (D) = det (ED — À). (1.58) 


De (57) il ressort que 


ñn 
À Bn(D)ralz(t)— 95] 
(=! 


De cette façon l'équation différentielle vérifiée par la coordonnée 
généralisée q; qui nous intéresse, s'écrira 


| f(D)g;=g(D){z(t)—0;}, (1.60) 
ou 
g(D)= 2 B(D) mi. (1.61) 


Etant donné que B;, (D) est un cofacteur de l'élément situé à l’inter- 
section de la /-ième ligne et la j-ième colonne du déterminant de la 
matrice ED — À, le degré du polynôme g (D) est inférieur à celui 
du polynôme f (D). Les polynômes f (D) et g (D) peuvent être mis 
sous la forme 


f(D)= aD"+uD1+...+an1D+an, 


. (1.62 
g(D)= boD" + bD* +... +by4D +b, — ) 


2—0393 
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Si le système est stationnaire, les coefficients des polynômes (62) 
a (i—0,1,...,n), b, (k = 0, 1, ..., v) sont constants. 

D'une façon analogue à ce qui a été exposé ci-dessus, dans le 
système envisagé, qg, peut être considéré comme signal de sortie et 
z (t), comme signal d'entrée. 

Pour rendre plus commode la comparaison avec les systèmes 
examinés, remplaçons gqg; par x et écrivons l'équation (60) sous la 
forme suivante: 


f(D)z=8(D)e, | (1.63) 


E=Z— 2%, 
où e désigne l'écart. Si l’on introduit les notations 


_g8(D) _ boDY+bD V1... + by sD + 
FD =) e0D a D Te anD+an" (1-64) 
on peut ramener le système des équations (63) à la forme 
z=G(D)(z— 7) 


ou 
1 + G(D)]z =G(D)z(. (1.65) 
Si l’on note | 
L (D) EUROS (1.66) 


l'équation (65) devient 

x = L(D)z (t). (1.67) 
EMA L'équation (67) est celle d'un système en boucle fermée mono- 
variable à nombrefini de degrés de liberté (fig. 1.8). La‘fonction L (D) 
est la fonction de transfert du système en boucle fermée. 


Fig. 1.8 


Puisque d’après (64) et (66) 


__ g(D) 
LD) = 75:06); 


l'équation (67) est équivalente à l’équation différentielle suivante 


[f (D) + g (D)z = g (D)z (1). (1.68) 
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Le diagramme fonctionnel du système er boucle ouverte est dans 
ce cas de la forme représentée sur la figure 1.9. Son mouvement est 
décrit par l'équation 


f (D) z = g (D) z (1). (1.69) 

Si l’on tient compte de l'expression (64), on peut ramener l'équation 
(69) à la forme 

z = G(D)z(t). (1.70) 


L'équation (70) est l’équation du système commandé en boucle ouver- 
te et la fonction G (D) est sa fonction de transfert. 


Fig. 1.9 


8. Une remarque sur l'intégration des équations du mouvement 
d’un système monovariable. Dans ce qui précède nous avons passé 
du système d'équations différentielles initial (53) à l'équation (60). 
La fonction z (4) fait partie de l'équation (60) sous le signe de l’opé- 
rateur différentiel, bien que le système d'équations (53) ne comportait 
pas les dérivées de z(/). La solution de l’équation différentielle 
(60) dépendra de la valeur initiale de la fonction z (t) elle-même 
et des valeurs initiales des dérivées de z (4) (jusqu’à la valeur initiale 
de la dérivée de z (t) dont le degré est d’un ordre inférieur à celui de 
l'opérateur différentiel g (D)). Cependant les valeurs initiales 
de la fonction z(t) elle-même et de ses dérivées (si ces dérivées 
n’entrent pas dans le système initial) n'interviennent pas dans la 
solution du système d'équations initial. 

Pour rendre clair le sens de cette question, examinons l’exemple 
suivant. Soit le système d'équations 


a + kg: — 0, | (1.71) 
Ge — kq = 2 (t). 


En éliminant des équations (71) la variable q, on obtient l'équation 
différentielle du deuxième ordre 


ge + Ka = 2 (t). (1.72) 
2% 
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Intégrons l'équation (72) en appliquant les méthodes du calcul 
opérationnel. Introduisons les notations 


Ne (P) get), E ED) 2 (0. (1.73) 


Etant donné que | 
Q2 (£) <- p°ne (p) — p°gs (0) — pq: (0), | 
z(£)<- p& (p) — pz (0), 
à l'équation différentielle (72) correspondra la transformation 
(p® + K?) n3 Cp) = pt (p) + p'ga (0) + pas (0) — pz (0). (4.75) 


D'où 


(1.74) 


1 3 3 1° k 
n(P)=— TE LP) +q2 (0) x + + lg (0) — 2 (0) 5x - 
(1.76) 
Si l'on retient que 
Pis + cos kt, ER — sin At 


et que d’après le théorème de multiplication des transformées 
t 


+ Er Cp) + cos k(t— +)z(t) dr, 


on obtiendra,’en vertu de (76), la loi suivante de la variation dans 
le temps de la coordonnée 9, : 


Q (t) = + (9: (0) — z (0)] sin kt + ge (0) cos kt + | cos k ({—+T)z(T) dr. 
0 


(1.77) 
Notons maintenant que le système d'équations initial (71) entraîne 
+ [92 (0) — 2 (0)]= gi (0), (1.78) 


et, par conséquent, la solution de (77) pourra être mise sous la forme 
î 
qe (t) = qi (0) sin kt + ge (0) cos kt + | cos k(t—T)z(t)dt. (1.79) 
0 ° 


La valeur initiale z (0) de la fonction z (t) n'intervient pas dans 
l’expression?(79). 

Ainsi, pour gs (0) = 0, gs (0) = 0 les deux premiers termes de 
l'expression (77) qui correspondent aux oscillations libres du sys- 
tème, s'éliminent et (77) devient 

t 


q2 (é) = | cos k (t— +) z(r) dr. (1.80) 


0 
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$ 2. Systèmes commandés multivariables 


1. Système commandé en boucle fermée. Un système commandé 
dont le signal d'entrée et le signal de sortie sont des vecteurs est dit 
multivariable ou à plusieurs variables (fig. 2.1). } 

Son diagramme fonctionnel est représenté sur la figure 2.2. 
Ici &, est un organe comprenant l’objet commandé, les amplifica- 
teurs et les éléments d'exécution. Par &, on désigne l'organe compre- 
nant l’ensemble des éléments sensibles, c’est-à-dire des appareils qui 


Fig. 2.1 Fig. 2.2 


mesurent les paramètres de l’état du système commandé. x, est le 
signal de sortie de l'organe «&,; c’est un vecteur de dimension mu. 
Par z, est désigné le signal de sortie de l’organe &., qui est un vecteur 
de dimension m». 

Les équations différentielles qui décrivent les processus se dérou- 
lant dans les organes &, et &, (en suivant le point de vue général 
de Lagrange, nommons-les équations du mouvement du système) 
peuvent être mises sous la forme du système d'équations différentiel- 
les vectorielles suivant 


fi (D) = ea (D) (2 — x2) +e (D)r, | (2.1) 
fs (D) 2 = €: (D) x. Le 

Ici /, (D) est une matrice m, X m, dont les éléments sont des 
polynômes en D (où D = d/dt) à coefficients constants. D'une façon 
analogue, fa (D) est une matrice polynomiale m, X mo»; €1 (D), 
une matrice my, X Ma; ea (D), une matrice m, X mi. 

L'entrée z (£) est un vecteur de dimension m,; r (t) désigne le 
vecteur de dimension m, qui représente l’ensemble de bruits (per- 
turbations) appliqués au système. e, (D) est une matrice d'ordre 
M, X My. 

Le vecteur z — x. est l'écart du système. Le système consiste 
à assurer à chaque instant un écart suffisamment petit. Les critères 
permettant d'apprécier la qualité de la réalisation de cette tâche 
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diffèrent suivant le système commandé concret. Dans ce qui suit 
nous donnons la description de certains de ces critères. 

2. Déterminant caractéristique d’un système en boucle fermée. 
L'entrée z et la perturbation r sont certaines (inconnues à l’avance) 
fonctions du temps 


z=2Z2(t), r=rt(é. 
Lorsqu'on étudie la stabilité d’un système, on ne considère que ses 


_ mouvements propres. En posant z (4) = 0, r(t) = 0, on obtient 
à partir de (1) les équations des oscillations libres du système 


f1 (D) & + & (D) xs = 0, 
fa (D) 2e — es (D) à = 0. 4 
La matrice opérationnelle du système d'équations (2 s'écrit 
C[ AO) « “A 
o-[ 0 Lol 7 


La matrice f (D) est une matrice partitionnée. Le déterminant 
de f (D) s'obtient après les transformations élémentaires suivan- 
tes. Multiplions la deuxième ligne de la matrice f (D) à gauche par 
la matrice —e, (D) f;* (D) (où f,' (D) est l'inverse de f, (D)) et addi- 
tionnons la ligne obtenue avec la première ligne. La matrice trian- 
gulaire f* (D) ainsi obtenue 
Fo [OT (D) 3" (D) e: (D) 0 | 
— €2 (D) f2 (D) 
est équivalente à la matrice f (D). Comme les déterminants des 
matrices équivalentes ne diffèrent que par le coefficient constant, 
l'opérateur A (D) de la matrice opérationnelle f (D) sera donc, à un 
coefficient constant près, 
A (D) = det [f, (D) + e (D) f:' (D) e (D)] det jf; (D). (2.5) 
En transformant l'expression entre crochets de (5), on a 
f1 (D) + e1 (D) f2" (D) e: (D) = fa (D) [Em + fi" (D) e1 (D) f5" (D) €: (D)] = 
= fi (D) Em + Wi (D) We (D) = f (D) Em + W(D), (2-6) 


(2.4) 


où 
_ F D D LA 
Wi(D)=f# (Dre (D)= PR, (=1,2, (27 
F;,(D D) Fo (D) 62 (D 
W(D)=Wi(D)W,(D)="OaOme (2.8) 


Em, désigne ici la matrice unité m, X m,. F; (D) est la matrice ad- 
jointe de f; (D) et À; (D), le déterminant de la matrice f, (D): 


A; (D) = detf; (D) (i = 1, 2). 
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Les expressions (7) montrent que W, (D) est une matrice m, X m, 
W, (D), une matrice m, X m,, et W (D), une matrice carrée m, X mi. 
La matrice W,; (D) (i = 1, 2) est une matrice de transfert de l'or- 
gane œj. 
Ainsi, l’expression (5) devient 
À (D) = det{f, (D) [Em -+ W (D)]} det f, (D). (2.9) 
Le déterminant du produit de deux matrices étant égal au produit 
de leurs déterminants, et, de plus, la multiplication des déterminants 
étant commutative, l'expression (9) pourra s’écrire ainsi: 
À (D) = À, (D) À, (D) det [Em + W (D)]. (2.10) 
Le déterminant (10) est le déterminant caractéristique du système en 
boucle fermée. 
L'équation caractéristique d’un tel système est la suivante: 


À (p) = 0. (2.11) 
Le système de commande en boucle fermée sera asymptotique- 
ment stable, si toutes les racines de l'équation caractéristique (11), 
i. e. tous les zéros de la fonction A (p), se trouvent dans le plan de la 
variable complexe p à gauche de l’axe imaginaire. 
3. Equation du contrôle automatique. Reprenons les équations (1) 
h (D) x + ea (D)z:=e (D)z+e, (D)r, 
— 9 (D) % + fe (D) ze = 0 
et éliminons de ces équations le vecteur z.. A cet effet, multiplions 
tous les termes de la deuxième équation (1) à gauche par la matrice 
—e, (D) f;' (D) et ajoutons l'expression ainsi obtenue à la première 
équation (1). On a 
[A (D) + e (D): (De (Dix = e (D)z+e.(D)r, (2.12) 
ou d'après (6) 
fi (D) (En + W(D)In = ea (D)z+e, (Dr. (2.13) 
En multipliant le premier et le second membre de (13) à gauche par 
la matrice f;' (D), on obtient 
[Em + W(D)Ix = ff" (D)ea(D)z+f"(D)e (D)r. (2.14) 
Introduisons les notations 
_ __ Fi(D)e, (D) 
fs (D)e (D)=— 75 — = RD). (2.15) 


La matrice À (D) sera du type m, X m,. On peut la nommer matrice 
de transfert des perturbations. 
Puisque d’après (7) 


= Fi(D)ei(D 
fr (D) e (D) OO = W: (D), 
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l'équation (14) se met sous la forme 
[Em + W(D)iz = W, (D)z+R(D)r (2.16) 
ou 
z, = [Em + W(D)]1W, (D)z+1[Ex + W (D)I1R (D)r. 
(2.17) 


L'équation (17) décrit les processus qui ont lieu dans le système 
en boucle fermée et s'appelle équation du contrôle automatique. 

4. Système commandé en boucle ouverte. La figure 2.3 repré- 
sente un système commandé en boucle ouverte. Des équations (1) 


Fig. 2.3 


il ressort que les processus qui se déroulent dans un tel système sont 
décrits par les équations différentielles vectorielles suivantes 


f\ (D) =ea(D)z(t) +e.(D)r, | 
fa (D) ze = €2 (D) 


Les équations des oscillations propres du système en boucle 
ouverte s’obtiennent à partir des équations (18) en posant z (t) = 0, 


(2.18) 


r () = 0. 
Ainsi on a 
ñ (D) = 0, | 9 
2.19 
fa (D) 2e = ex (D) za. SE 
La matrice opérationnelle du système d'équations (19) s'écrit 
ACER (2.20) 
' = —€2 (D) f:(D)J | 


Le déterminant À, (D) de la matrice f, (D) est de la forme 
A9 (D) = A, (D) 4: (D), (2.21) 


où, de même que précédemment, par À; (D) (i — 1, 2) est désigné le 
déterminant de la matrice f; (D). A, (D) est le déterminant caracté- 
ristique du système en boucle ouverte. 
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Reprenons le système d'équations (18). La première équation 
est intégrée indépendamment de la deuxième. On peut l'écrire sous 


la forme 
2 = fi (D) e (D) 2 + fi (D) e, (D)r. (2.22) 


En tenant compte des expressions (7) et (15), ramenons (2.22) à la 
forme 


L'équation (23) décrit le mouvement du système en boucle ouverte 
à la sortie de l'organe «.. 

L'équation du contrôle automatique (17) diffère de l’expres- 
sion (23) par la présence de l’opérateur[£,,, + W (D)]-! dans le second 
membre. Un système commandé doit reproduire le plus exactement 
possible le signal d'entrée z (t) et être peu sensible aux perturba- 
tions r (t). L'opérateur W (D) doit être construit de façon à satisfaire 
le mieux possible à ces contraintes. 

5. Interprétation des opérateurs matriciels W(D) et E,., + W (D). 
Considérons un système de commande dans lequel la liaison directe 
entre les éléments &, et «&, est coupée. Soit 


z()=0, r(=0, (2.24) 


et soit © ({) un certain signal, représentant un vecteur de dimen- 
sion m, (fig. 2.4), appliqué à l'entrée de l'organe @2. 


r(t) 


Fig. 2.4 


Conformément à (14), les processus qui se produisent dans le sys- 
tème ouvert à la sortie de l'organe «&, seront décrits par les équations 


jh (D) = —€ (D) za, 
fa (D) 2 = €: (D) Ÿ (1). (2.25) 
Il en résulte, compte tenu de (7), 
T1 — —W, (D) Lo; | 
Eh TS (2.26) 
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hs z = —W, (D) W, (D)Ÿ (1). (2.27) 
Comme d'après (8) 
W, (2) W, (D) = W(D), (2.28) 
l'équation (27) devient 
z = —W (D)ÿ (1). (2.29) 


De la sorte, la matrice W (D) est la matrice de transfert prise avec 
le signe opposé du système commandé ouvert à la sortie du premier 
organe. 


Considérons maintenant la possibilité d'interpréter l'opérateur 
Em, + W (D). Le signal à la sortie de l'organe «;, c’est-à-dire le 
vecteur zx, après le passage du signal Ô ({) par le système ouvert 
représenté sur la figure 2.4, est défini par l'expression (29). La diffé- 
rence entre le signal 8 ({) appliqué à l’entrée de l'organe «, et le 
signal reçu à la sortie du système ouvert sera 

9 (4) —[—W(D) 8 (81 = {Em + W (D) à (2). (2.30) 


La grandeur (30) a été appelée par Bode différence de retour. Dans 
ce sens la matrice carrée Em, + W (D) peut s'appeler matrice de 
différence de retour. 


6. Sur la reproduction du signal d'entrée dans un système multi- 
variable. L’équation (17) qui décrit les processus se déroulant dans 
un système multivariable s'écrit 


Li = [Em + W (D) W, (D) 2 (1) + [Em + W (D) RO) r(t). 
Comme d’après (8), avec m, — ma, 
W, 2) =W(OD)W; (D), (2.31) 
(17) peut se mettre sous la forme 
2 = (En + W (D) W (D) W:! (D) z (8 + 
+ [En, + W (D) R (D) r (+). (2.32) 
La deuxième équation du système (1) conduit à 
ze = W, (D) x. (2.33) 
En portant dans (33) la valeur de 7, tirée de (32), on obtient 
Ze = Was (D) LEn, + W(D)'W(OD) WF (D)z(t) + 
+ W, (D) En + W (D)ITR (D) r (à. (2.34) 
Pour r(t)=0, l'expression (34) devient 
Za = Woe(D) LEm + W(D)'W(D)W: (D)z(t). (2.35) 


L'équation (35) est une généralisation de l'équation (1.39) qui décrit 
la reproduction du signal d’entrée dans un système monovariable. 
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$ 3. Méthodes fréquentielles d’étude de la stabilité 
des systèmes commandés linéaires 


1. Transformation du déterminant caractéristique d’un système 
commandé en boucle fermée. Comme il a été montré au $ 2 (2.10), 
le déterminant caractéristique du système en boucle fermée est de la 
forme 


A (D) = A, (D) A, (D) det [En, + W (D)]. 


Ici A, (D) (i = 1, 2) sont les déterminants caractéristiques des 
organes du système de commande; d’après (2.21), le produit de ces 
déterminants est le déterminant du système en boucle ouverte 


A, (D) = A, (D) 4; (D). 


Donc le déterminant du système en boucle fermée sera 


À (D) = A, (D) det [En, + W (D). (3.1) 
Suivant (2.7) et (2.8) 
; Fi (D) ei (D) Fa (D) ea (D | 
W(D)=Wi(D)W,(D)= AE, (3.2) 
par suite 
__ Fi(D) ei (D) Fa (D) es (D) 9 
W (D) = AD rERtD) es D (3.3) 


La matrice W (D) est une matrice carrée m, X m, et en vertu de 
l'expression (3), tous les éléments de la matrice 


Wau(D) Wis(D) ... Wim, (D) 
| (3.4) 


W (D) — 


W m1 (D) Womi2 (D) se Wim: (D) 


sont des fonctions rationnelles de l'opérateur de différentiation D, 
le dénominateur de chacune d’elles étant égal à A, (D). 
La matrice E», + W (D) s'écrit 


A+Wu(D) Wu(D) ... Wim(D) 
Be ÉMUD) El eee Le me atom uous (3.5) 
= Won (D) W m2 (D) ..1+ Wim (D)_ 
Son déterminant peut être ramené à la forme 
det [Em + W (D)] = 1 + K (D), (3.6) 
où À (D) est une fonction rationnelle de D: 
K(Dj=2 2). (3.7) 


[Ao (D)}"* 
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et L (D) un polynôme en D. Il résulte des expressions (6) et (1) que 


A (D) = A, (D) + K(D)] (3.8) 
ou d'après (7) 
A(D)=À, An 
(2) CS Eure Di (3.9) 


À (D) étant une fonction entière (puisque c’est le déterminant du 
système en boucle fermée), il s'ensuit que 

L(D)= M (D){Ao (D) ", (3.10) 
où M (D) est un polynôme en D. 

Ainsi, 

M (D) 
4o (D) 
L'expression (8) se met maintenant sous la forme 


A(D)=A, (D) [1+ 02 ]= 40 (D) + M (D). (3.12) 


K (D)= (3.11) 


Pour qu'un système de commande soit asymptotiquement stable, 
il faut que tous les zéros du polynôme A (p) se situent dans le demi- 
plan gauche de la variable complexe p. 

Les conditions nécessaires et suffisantes pour que ces contraintes 
soient vérifiées sont données par le critère de Hurwitz (17, 21]. 
Toutefois, dans ce sens le critère de Nyquist présente des possibilités 
plus grandes du fait qu'il permet de se faire une idée de la stabilité 
d’un système en boucle fermée d’après les lieux de transfert du système 
en boucle ouverte. 

On appelle une caractéristique fréquentielle d’un système en 
boucle ouverte la fonction 


W (io) = [W (p}lp=iw (—% < © << co), 
où W (D) est la matrice de transfert du système ouvert, définie 


au $ 2 par la formule (2.28). 
Puisque d’après (2.28) 


WOD)=W, 0) W, (D), 


où W, (D) et W, (D) sont les matrices de transfert des éléments du 
système, on a 
W (io) = W; (io) W, (io), 


et pour construire le lieu de transfert d’un système en boucle ouverte 
il ne faut connaître que les lieux de transfert de ses organes. Or, si 
l'on ne connaît pas l’expression analytique des fonctions W, (D), 
les lieux de transfert en question peuvent être établis par 
expérience de la façon décrite dans ce qui suit. Ainsi l’importance 
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principale du critère de Nyquist consiste dans le fait qu'il permet 
de juger sur la stabilité en boucle fermée non seulement d’après les 
caractéristiques analytiques mais aussi d’après les caractéristiques 
empiriques du système er boucle ouverte. Ce _critère, dont nous don- 
nons la déscription ci-dessous, a été proposé par Nyquist [13] pour 
les amplificateurs à réaction et appliqué par A. Mikhaïlov [65] et 
autres aux systèmes réglables. 

2. Critère de stabilité asymptotique des systèmes en boucle fécnée 
ne comportant que des éléments stables (critère de Nyquist). Exami- 
nons d’abord les systèmes commandés dont les éléments sont stables. 
Cela signifie que les déterminants caractéristiques des éléments A, (p) 
n’ont pas de zéros dans le demi-plan droit de la variable complexe p. 

Nous allons nous borner à l'examen des systèmes tels que le 
degré du numérateur de la fonction 


M (D) 


a eu Ao (2) 


ne soit pas supérieur au degré du dénominateur. Comme d'après (8) 
M 
A(p)= A (p)1+K(p)=4o(p)[1+ 0]. 


Ao(P) 
on voit bien que la fonction A (p) a pour zéros les zéros de la fonction 


1+K (p)= DEAR) (3.13) 


Les zéros de la fonction 1 + Æ (p) sont formés par les zéros de son 
numérateur, et les pôles de.cette fonction, par les zéros de son déno- 
minateur. Si tous les organes du système sont asymptotiquement 
stables, la fonction A, (p) ne possède pas de zéros dans le demi-plan 
droit de la variable complexe p. Pour cette raison la valeur de l’in- 
tégrale qui suit, prise suivant le contour fermé C situé dans le demi- 
plan droit de p, est donnée par l'expression 


1 Ç K'(p) dp h 
QT FEU M +P= (3.14) 


où W est le nombre de zéros et P le nombre de pôles que la fonction 
1 + Æ (p) possède dans le domaine délimité par le contour C. 

Remarquons que généralement, en énonçant le théorème de Cau- 
chy, on recourt dans la théorie des fonctions de la variable complexe 
à la rotation suivant le contour extérieur fermé s'effectuant dans le 
sens inverse à celui des aiguilles d’une montre, c’est-à-dire de façon 
que le domaine délimité par ce contour reste à gauche. Comme nous 
avons adopté ici le parcours dans le sens des aiguilles d’une montre, 
le second membre de l'expression (14) s'écrit —N + P 
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Si à l’aide de la représentation conforme 


K = K (p) 
on applique le contour C sur le plan X, l’expression (14) devient 
1 dk 
mi THE — —N, (3.15) 


où l'est le contour dans le plan X obtenu par représentation conforme. 
Le sens de parcours le long de ce contour est défini par l’application 
et ne peut être choisi arbitrairement. 

Puisque les coefficients des polynômes 4 (p) et À, (p) sont réels, 
aux points réels 'p correspondent les points réels du plan Æ. Au 
point p = 0 et au point à l'infini p — œ correspondent également 
les points réels Æ (0) et Æ (oc). Aux points p = e + iw et p — 
= £g — io correspondent les points symétriques X (8e + io) et 
K (e— iw) = K (8e + iw). Donc, si le contour C est symétrique par 
rapport à l’axe réel, lle contour l situé dans le plan X Île sera égale- 
ment. La grandeur 1 + Æ est une grandeur complexe.| Dans le plan 
K elle représente le rayon vecteur d’un point situé sur le contour T. 
L'origine de ce rayon vecteur se trouve au point. (—1, O). 


Puisque 
1+K=]|1+X{etare(i+K), (3.16) 
In({1+kK)=ln|1+A|+iarg({+X), (3.17) 
dK , : 
TT =din|{+K|+idarg(1+K), (3.18) 
il vient 
: ? A arg ({ ;s 
NES RE Q dar (+= RE, (5.19) 
: : 


où À arg (1 + Æ) est l'accroissement de l'argument du rayon vec- 
teur 4 + X lorsqu'on parcourt le contour fermé T. L'intégrale du 
premier terme de l'expression (18) 


$din|i+K|=0, (3.20) 
r 


puisque le contour [est fermé. 

Ainsi, V est égal au nombre S de tours complets du vecteur 14 + 
autour du point (—1, 0), lorsque p décrit le contour C dans le sens 
des aiguilles d’une montre, les rotations du vecteur 1 + Æ étant 
également considérées positives dans le sens des aiguilles d’une 
montre 


S=N. (3.21) 
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Remarquons que si l’on considère les rotations du vecteur 14 + X 
positives lorsqu'elles s'effectuent dans le sens opposé à celui des 
aiguilles d’une montre, alors, d'après (15), le nombre de tours du 
vecteur 1 + X sera égal à —N. 

Pour résoudre le problème relatif à la stabilité asymptotique 
d'un système en boucle fermée, il faut choisir dans le plan p un 
contour encerclant le demi-plan droit tout entier. 

Supposons que le contour dans le plan p soit composé d’un demi- 
cercle Z de rayon R centré à l’origine des coordonnées et de son dia- 
mètre C”’ + C reposant sur un axe imaginaire (fig. 3.1). Le sens de 
parcours est celui des aiguilles d’une montre. 

Quand p varie le long de l’axe imaginaire de O à +ico, le point 
K (p) parcourt le trajet l' du point Æ (0) au point Æ (co) situé sur 


Fig. 3.1 


l'axe réel. La symétrique l” de ce trajet par rapport à l’axe réel 
ri d’obtenir le contour fermé T + ll” matérialisé par le trait 
plein. 

Au demi-cercle ZL de p=— + iR à p = —iR en‘passant parp = R 
correspond l'arc À de À = K (+iR) à À = K (—iR) passant par 
K = K (R) sur l’axe réel. Cet arc À est une bifurcation du con- 
tour [+ T. 

Avec À — oc le contour dans le plan p entoure à la limite le 
demi-plan droit tout entier. On voit aisément que si À — la 
ramification À se trouve contractée au point ÆX (œ). En effet, pour 
p = Reï, nous aurons 


__ M(p) __ aoRe‘9+a;Rn-teietn- DE, La, 
a AoP)  boRrePnbiRn-leifen DE LD, ? 29 
. _ . (7,) 
Him X(p) — K (00) — DL (3.23) 
Si le degré du polynôme M (p) est inférieur à celui de A, (p), 


c'est-à-dire si ay — 0, on a Æ (oo) — 0. Ainsi, avec À —+ oc, il 
ne reste sur le plan X que le contour fermé L + l”. 


32 SYSTÈMES COMMANDÉS LINÉAIRES (CH. 1 


Le nombre $S de tours du contour l' + T” autour du point (—1, 0) 
dans le sens des aiguilles d'une montre est égal au nombre de zéros N 
du déterminant caractéristique À (p) dans le demi-plan droit p. Si le 
nombre de tours est nul, le système en boucle fermée est asymptotique- 
ment stable. 

En particulier, si le contour FL + ['’ n’a pas de points doubles, 
la stabilité asymptotique n’a lieu que dans le cas où le point (—1, 0) 


a) Système stable b) Système instable 


Fig. 3.2 


repose au-dehors du contour. C'est ce qui détermine le critère de 
Nyquist [17]. 

Constatons que des cas sont possibles où le contour L + [” 
embrasse le point (—1, 0) mais les points doubles (fig. 3.2) font que 
le nombre de rotations du contour autour du point (—1, 0) est nul. 
Dans ces cas le système est stable. 

Signalons encore la position relative des points Æ (0) et Æ (co) 
dans le plan X. Il est facile de voir que les nombres A, (0) et À, (co) 
ont toujours les mêmes signes, sinon le polynôme A, (p) aurait au 
moins une racine réelle positive, ce qui contredit l'hypothèse sur la 
stabilité d’un système en boucle ouverte. Si un système en boucle 
fermée est stable, les nombres A, (0) + M (0), A, (co) + M (co) 
doivent être de même signe, d'où il s'ensuit que les signes des nom- 
bres réels 1 + Æ (0), 1 + Æ (vo) doivent être les mêmes. Ainsi, dans 
un système stable, les points X (0) et À (co) reposent du même côté 
du point (—1, 0). Dans un système instable, les points X (0) et 
K () peuvent se trouver soit d’un côté, soit des deux côtés diffé- 
rents par rapport au point (—1, O). 

3. “Application du critère de Nyquist aux systèmes à organes 
neutres. Les objets à asservir peuvent être neutres ou instables 
(machine à vapeur, navire, avion neutre ou statiquement instable) 
et le problème ! d’asservissement consiste à les rendre "stables. 
Parmi les éléments d'un régulateur il existe également des orga- 
nes neutres (servo-moteurs). En présence des éléments neutres le 
point p — 0 est le pôle de la fonction Æ (p), et en construisant 
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un contour dans le plan p, ce pôle doit être contourné suivant le 
petit demi-cercle / de rayon r (fig. 3.3). 


Si le point p = 0 est un pôle d'ordre un, dans son voisinage la 
fonction À (p) se comporte comme ee . et aux arguments <+i0, —i0 


de la fonction X (iw) correspondent les branches des courbes T, l”, 
qui s’éloignent à l'infini le long de l’axe imaginaire. Le demi-cercle 


= \ 
D “A NA H'r) 
7 


a pour image une courbe voisine d’un demi-cercle de rayon infini 
décrite dans le sens des aiguilles d'une montre et qui se joint aux 
branches infinies des courbes l', l”. Lors- 
que À —+ co, r —+ 0, l'arc À qui est l’ima- | 
ge ‘du demi-cercle Z se contracte en un 
point À (), et l'arc À qui est l'image 
du petit demi-cercle / s'éloigne à l'infini. 
Finalement, il ne reste de nouveau 
que la courbe F + L”’ dont les branches 
infinies doivent être supposées fermées 
par un demi-cercle de rayon infiniment 
grand, situé dans le demi-plan À droit. 
Au contour fermé ainsi obtenu on peut 
également appliquer le critère de Nyquist. , 
Le lieu de Nyquist de la figure 3.3 se Fig. 3.4 
rapporte à un système stable dont le point 
p—0 est un pôle de premier ordre. Le cas de la figu- 
re 3.3 vérifie la relation 


S+F+=N. (3.24) 


Le lieu de Nyquist représenté sur la figure 3.4 se rapporte à un 
3—0393 
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système stable pour lequel le point p = 0 est un pôle de deuxième 
ordre. 

Si le point p = 0 est un pôle d'ordre #, la courbe L + F’ doit 
être fermée par une ligne éloignée à l'infini comportant n demi- 
cercles décrits dans le sens des aiguilles d’une montre. Cela résulte 
du fait que dans le voisinage de p = 0 la fonction X (p) se comporte 

1 1 ’ + Je ; . 
comme ————, c'est-à-dire que dans le plan X l'angle polaire 
P ren 
est z fois plus grand que son homologue dans le plan p. Dans le cas 
envisagé on a 


S+-=N. (3.25) 


&. Application du critère de Nyquist aux systèmes à organes ins- 
tables. En présence d’un organe instable, la fonction X (p) pos- 
sède un pôle d'ordre de multiplicité z7 au point p = aoù Re a > 0. 
Supposons pour fixer les idées que le point a repose sur l’axe réel. 
En construisant le contour dans le plan p, faisons exclure le pôle a 
à l’aide du cercle Z de petit rayon r, décrit dans le sens opposé 
à celui des aiguilles d’une montre. La courbe À qui lui correspond 
dans le plan X est voisine d’un cercle de rayon infiniment grand, 
décrit z fois dans le sens des aiguilles d’une montre. 

Pour cette raison, en appliquant le critère de Nyquist, il faut ajou- 
ter au contour l'+[” un cercle infiniment grand décrit » fois dansle 
sens des aiguilles d’une montre. Ceci résulte du fait que dans le 


Fig. 3.5 


voisinage du pôle p = a la fonction Æ (p) se comporte comme 


ee (3.26) 


(p— a)" rneivn 
La présence d’un organe instable conduit à la relation 
S+n=N. (3.27) 
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Le lieu de Nyquist représenté sur la figure 3.5 se rapporte à un 
système stable dont le point p = a est un pôle de premier ordre 
(n = 1). 

Dans tous les cas examinés aux points 3 et 4, la formule 


N=S+P (3.28) 


s'avère valable si l’on prend les pôles simples situés aux points 
intérieurs du demi-plan droit pour une unité et ceux qui se situent 


; : ei Â à : L 
sur l’axe imaginaire pour D: les pôles multiples respectivement pour 
n et . : 
5. Lieux de transiert des systèmes commandés et leur détermination 
expérimentale. Comme nous l’avons montré au point 2, l’application 


du critère de Nyquist dans le cas de la construction d’une représenta- 
tion conforme À = X (p) n’exige réellement que la construction de la 


Fig. 3.6 


représentation Æ (io) (—oo << ® << co). Or, comme d’après (6) 
1+X (io)= det [En +W (iw)] = det [Em + Wa(io) Wa (iw)], (3.29) 


pour pouvoir appliquer le critère de Nyquist, il ne faut connaître 
que les lieux de transfert de W, (iw) (s = 1, 2) des organes du sys- 
tème. Puisque W, (D) (s = 1, 2) est une fonction rationnelle de D 
dont les coefficients sont réels, W, (—iw) = W, (io) ; il suffit donc 
de définir la fonction W, (iw) seulement sur l'intervalle 0 < wo << co. 

Voyons maintenant s’il est possible de déterminer expérimentale- 
ment le lieu de transfert d’un organe décrit par une équation diffé- 
rentielle vectorielle du type 


f(D)rz=e(D) #8 (t. (3.30) 


Soient f (D) la matrice r X n, x le vecteur de dimension n, e (D) 
la matrice z X m, Ÿ (t) le vecteur de dimension m. 
L'équation (30) entraîne 


z= Y(D) 8 (1), (3.31) 
où 
Y(D)— RE (3.32) 


La matrice de transfert W (D) de l'organe considéré (fig. 3.6) est 
une matrice z X m. 


3° 
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Soit le signal d'entrée ® (4) 
8 (4) = À cos wit = (Aeïvit+ 4e ioit), (3.33) 


où À est un vecteur de dimension m. L'’équation différentielle vec- 
torielle (30) pourra maintenant s’écrire 


f(D)z=Le(D)(Aeïvit + Ae-ivst), (3.34) 
En admettant que iw, n’est pas une racine de l’équation caracté- 


ristique det f (p) = 0, cherchons une solution particulière de l’équa- 
tion (34) sous la forme 


7 = À (hyeisit + hue-ioit), (3.35) 
Portons l'expression (35) dans (34) pour trouver 
hi = Y (io) 4, he = Ÿ (—io:) À. (3.36) 
Ainsi, 
Z= . LŸ (io) Aeivit + Ÿ (— io) Ae- vit]. (3.37) 


L'élément zx, du vecteur x peut se mettre sous la forme: 


m m 
z; = £ [ D. L'ET (io) Aneivit L > L'ET (— ios) Aye it]. (3.38) 
k=1 k=1 
Désignons par R;, (w,) et ya (@,) le module et l'argument de la 
grandeur complexe Y,, (io): 
Ya (io) = Rp (ose Vire, (3.39) 


Comme nous l'avons indiqué plus haut, la fonction Y,;, (iw) est le 
lieu de transfert ou le lieu de réponse en fréquence ; la fonction R;, (w) 
est une réponse fréquentielle ex amplitude ; la fonction 1,4 (w), une 
réponse fréquentielle er phase. La fonction 


Pin (wo) = Re Fin (io) 
se nomme réponse en fréquence réelle et la fonction 
Qn (o) = Im Ty (io), 
réponse en fréquence imaginaire. 
En vertu de (39), la solution particulière de (38) peut s’écrire 


z) = à R x» (os) An cos [ot + by (@1)]  (j=1,...,n). (3.40) 
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D'après l'exposé ci-dessus, la matrice 
Y (io) = [Ta (0)] = [Rjx (0) er] (3.41) 


est la matrice de réponse en fréquence de l'organe étudié. 
Décrivons maintenant une expérience qui permet de déterminer 
la matrice Ÿ (iv). 
Soit le vecteur À figurant dans l'expression (33) dont un seul 
élément À, + 0, alors que A, = A3 = ...— Am — 0. L'expres- 
sion (40) devient alors 


zj= R ji (@1) A: cos [ost + 1 (wi)] (j=1,...,n). 


Après avoir mesuré le signal à la sortie du système (après l’amortisse- 
ment des oscillations propres du système), trouvons les valeurs de 
Rj1 (o,) et bn (w1) G = 1, ..., n). En reprenant l'expérience avec 
Ô (1) = À cos œet, Ÿ (t) — A cos @st, etc., on peut construire les 
courbes des fonctions R;,(w) et nn (©) (j = 1, ..., n). Ainsi, 
à l’aide de l'expérience décrite nous trouverons les éléments de la 
première colonne de la matrice (41), c'est-à-dire les fonctions 


LET (io), 


YF, (io). 


En procédant maintenant à la deuxième série d'expériences qui ne 
diffère de la première que par 4, + 0, alors que À, = A4, = À, — 
= = Am = 0, nous pourrons, d’après les données de mesure, 
déterminer les éléments de la deuxième colonne de la matrice (41), 
c'est-à-dire les fonctions 


Who (io). 
Après m séries d'expériences de ce type, on obtient toute la matri- 
ce Ÿ (io) 
Yi: (iw) LT (iw) + Pin (io) 


Vito) Pre(io)... Fam (iQ)_ 


Les lieux de transfert des organes isolés (et, par suite, du système 
en boucle ouverte tout entier), nécessaires pour appliquer le critère 
de Nyquist, peuvent être obtenus par expérience. Ceci est très im- 
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portant lorsque la description analytique complète de certains élé- 
ments ou les valeurs de certains paramètres des éléments, etc., 
sont inconnues. Toutefois, on doit être sûr que l'élément considéré 
est décrit par les équations différentielles linéaires à coefficients 
constants. 

6. Exemple de construction du lieu de Nyquist. Examinons le 
système décrit. par les équations différentielles 


Dr + 2 = —p 2 (4) — zel, | (3.42) 
Dis + Ze = Mn: 
Selon les. notations du $ 2, les équations (2.1) deviennent 
f\(D)= D +1, 4 (D)= — Ua; 
f2(D)=D+1, e(D)= 1, | 
W: (D) EE Da ? Wa (D) _— Da ’ (3.43) 
W (D)=W,(D)W: (D)= — Din 


Dans cet exemple m, = 1, c’est-à-dire la fonction W (D) est un 
scalaire, et donc 


det [Em + W (D)] = 1 + W (D). (3.44) 
Par conséquent, la fonction X (D), déterminée d'après (6), se met 


Fig. 3.7 
ici sous la forme 
K(D)=W(D)= — DE (3.45) 
Il en résulte que 
K (iw)= — Tr — pipe Se. (3.46) 
|A (iw)|=É, A(oo)=0, K(0)=—ine. (3.47) 


1+o? ? 


Le lieu de Nyquist de l'exemple examiné est donné par la figure 3.7. 
Cette figure montre que le système (42) sera stable si on respecte la 
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condition ù 
His € À (3.48) 


La condition de stabilité (48) coïncide évidemment avec celle 
obtenue à partir de l’équation caractéristique du système des équa- 
tions différentielles (42): 


p+i 
TE ler+epti-uue0. (849 


7. Systèmes à organes de retard et leurs critères de stabilité. 
Examinons un système monovariable (fig. 3.8) décrit par les équa- 
tions différentielles scalaires 


f (D) z (t) = g (D) 2 (4) — 2 (0), | 
Z () = z(t—T) (Tr = const), 


où f (D) et g (D) sont des polynômes (à coefficients constants) par 
rapport à l'opérateur de dérivation D = d/dt: 


f(D)= a0D" + a D +... Lan1D+an, | (3.51) 
g(D) = bDT + DIE... Lbm1D +bm (m<n). ° 


La première équation (50) décrit les processus ayant lieu dans le 
premier organe du système (fig. 3.8). La fonction de transfert G (D) 
de cet organe est 


A (p) = 


(3.50) 


D 
G(D) 7 | (3.52) 


La deuxième équation(50) décrit les processus qui se déroulent dans le 
deuxième organe dans lequel a lieu le retard du signal d’une valeur 


Fig. 3.8 


t = const. Cet organe peut se nommer organe de retard. Le système 
d'équations (50) peut être remplacé par une équation différentielle- 
fonctionnelle équivalente 


fOD)z() +g(D)z(t— 7 =8(D)z(t). (3.53) 


Les équations différentielles-fonctionnelles constituent une classe 
très importante des équations fonctionnelles. La théorie des équations 
différentielles-fonctionnelles a été élaborée par L. Pontriaguine, 
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A. Mychkis, R. Bellman, N. Krassovski, L. Elsgoltz, V. Zoubov et 
d’autres savants [11, 31, 43, 67, 92]. 

Les oscillations libres d’un système en boucle fermée (fig. 3.8) 
seront décrites par une équation différentielle-fonctionnelle homogène 


fD)z( +g(D)z(t— +) = 0, (3.54) 
tirée de l’équation (53) en y posant z (ét) = 0. 
La solution particulière de l’équation (54) sera recherchée sous 
la forme 
z(t)= Cie"i!, (3.55) 
où y; —=const. Puisque d'après (55) 
x (4 = T) _ Cie” ievit, 


ds 
dts 


après le report de (55) dans (54), on obtient 
f (ve) Cie + eg (vi) Cuei = 0. (3.56) 


[x (—7T)] = Cie Viysevit G=1;2;:.:), 


Etant donné que Cie" 0, il résulte de l'équation (56) que y: 
doit être la racine de l’équation 


A(Pp)=f(p)+e"g(p). (3.58) 


(57) est l'équation caractéristique de l'équation différentielle- 
fonctionnelle (54). D'après (58), l'équation caractéristique (57) est 
une équation transcendante. 

Aux racines multiples y, de l'équation caractéristique (57) cor- 


. t . . 
respondent non seulement la solution e*s mais encore les solutions 
teYst, test... a tevst, 


où g, est l’ordre de multiplicité de la racine y.. 

Pour les équations différentielles-fonctionnelles linéaires de la 
forme (54) à coefficients constants et à retard constant (t = const), 
telles que toutes les racines de l'équation caractéristique (57) pos- 
sèdent les parties réelles négatives, on°a démontré [31] que toute solu- 
tion peut être développée en une série absolument et uniformément 
convergente composée de solutions fondamentales 


x (t) = > P; (+) ext. | 
s=1 
Re >Reh> …. > Rein > ses 


(3.59) 
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où P, (t) sont des polynômes ent t de degré égal ou supérieur à g, — 1. 
Pour ces mêmes équations on a démontré également [31] qu'avec 
1>œ> lo +T, on a 


F2, Pa(er]< Berre (3.60) 


où B et & sont des constantes, et e est de plus un nombre positif aussi 
petit que l’on veut. 

De ce qui vient d’être dit il résulte que pour faire tendre asympto- 
tiquement vers zéro toutes les solutions z (t) de l'équation (54) avec 
t— oo, il faut et il suffit que toutes les racines de l'équation caracté- 
ristique (57) aient leurs parties réelles négatives. 

Ainsi, la condition de stabilité asymptotique d’un système en 
boucle fermée (54) muni d’organes de retard consiste dans le fait 
que le quasi-polynôme (58) qu’on peut écrire sous la forme 


À (p) = j (p) [1 + X (p)l, (3.61) 
avec 
K (p}=e-r EL e-#G (p), (3.62) 


ne doit pas posséder de zéros dans le demi-plan droit de la variable 
complexe p. 

Comme il résulte de la démonstration du critère de Nyquist, la 
détermination du nombre de zéros du quasi-polynôme A (p), situés 
dans le demi-plan droit de la variable complexe p, peut s'effectuer 
dans le problème considéré d’après ce même critère exposé ci-dessus 
aux points 2, 3 et 4. Cette possibilité a été montrée par I. Cypkin. 
Conformément à l'expression (62) 


K (io) = e-ietG (iw). (3.63) 
Puisque d'après (63) 


K (iu) = | K (iw).] e {276 tie) — | G (iw) |eilars Gtiv)-ur, 


pour tout & — &, le vecteur Æ (iw.,) sera égal en module au vecteur 
G (iw,), mais fera avec lui un angle w,t dans le sens des aiguilles 
d’une montre (fig. 3.9). Dans le domaine de faibles valeurs de w, 
les hodographes des vecteurs XÆ (iw) et G(iw) diffèrent peu mais 
avec l'accroissement de w la différence wt des arguments de X (iw) 
et de G(iw) devient de plus en plus importante. Pour «© — ©, 
l’hodographe X (iw) s’enroule asymptotiquement sur le point Æ (co) 
reposant sur l’axe réel. 

S’il existe des valeurs de « telles que | G (iw) | > 1, alors même 
dans le cas où l’hodographe du vecteur G (iw) n’entoure pas le point 
(—1, 0), c’est-à-dire celui d’un système stable sans retard, il devient 
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possible que le point (—1, 0) soit entouré par l’hodographe du vec- 
teur À (iw). Autrement dit, des cas sont possibles où l'introduction 
d’un organe de retard dans un système en boucle fermée stable trans- 
forme ce dernier en système instable. 

La construction efficace des solutions des équations différentiel- 
les-fonctionnelles est une tâche suffisamment ardue. Dans certains 


Fig. 3.9 


cas il est rationnel d'appliquer les méthodes de calcul opérationnel. 
A titre de tel exemple examinons l'équation 
zh +az(é + aex(t) = b{z(t) —z(t— +] (x = const). 
(3.64) 


Désignons par &(p) et E (p) les transformées des fonctions 2z (4) 
et x (t): 


C(P)->2(4), E(p) zx (6). 


Comme 
z(#)<- PE (p)— p'z(0)— px (0), z(t)<- pE (p)— pz (0), 
0 
z(—r)e-rE(p)+e-”p | z(t)ert dt, 


la transformée de la solution cherchée zx(t) est 


e 0 
_,Z(0)p+a;z(0)+z(0) be P* -pt 
ER me (mL be-Fe rer PE EL dt + 


LE (p)__ 3.65 
Fo +èe re ? sé 


f (p) = p° + @p + üe. 
Pour trouver la solution, il faut chercher l'original dont la transfor- 
mée est E (p). On voit de (65) que la solution cherchée dépend de la 


où 
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variation de la fonction zx (tÿ sur le segment —tT<1t<0. Pour 
rendre le problème résoluble, la fonction 
pÜ=z(t (—r<t<0), (3.66) 


dite fonction initiale, doit être donnée à l’avance. La solution de (64) 
qui satisfait à la condition (66) est notée zx, (1). 

8. Courbes logarithmiques. La fonction de transfert d'un système 
: boucle ouverte monovariable décrit par l'équation différentielle 
inéaire 


f(D)z=g(D)z@) (D=<+), (3.67) 


f(D)= aD"+aDT1+ ...+an D + an, | 7. 
g (D) = bo" + DD +. +bmaD+bm (men), JC) 
s'écrit 
_ boDMm+b,Dm-i LE dure Lbm1D + bm 
G (D) Eu apDr+a;Dn-1+ See +an-1D+an : (3.69) 


Pour z (t) = 1 (t) l'équation différentielle (67) possède une solution 
particulière 


z=Ko, (3.70) 
avec 
bm 
Ko= d: . 


La grandeur X, s'appelle gain en boucle ouverte. 
Introduisons les notations 
bo m b, 
De Ve 
Go (D) L do pr 41 pr-i np " 
Fes D EEE RE Er + 


pi... + it D+4 
m , (3.71) 


et mettons la fonction de transfert du système en boucle ouverte 


sous la forme 
G (D) = K°Go (D). (3.72) 


Nous avons déjà dit que la fonction G (iw) = {G (p)lh=tw S'appel- 
le réponse en fréquence en boucle ouverte. En désignant par R (w) 
le module de la fonction G (iw) et par 1 (w), l'argument de cette 
fonction, on a 
G (iw) = R (o) eivtu) (3.73) 
ou 
G (io) = Kofo (w) eiV(u), (3.74) 
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avec 


Ro (w) = | Go (iw)|. (3.75) 


En calculant les logarithmes des premier et second membres de 
l'expression (74) on obtient 


1g G (io) = 1g K, + Ig Ro (wo) + ib (o)Ige. (3.76) 
On appelle réponse en amplitude logarithmique la fonction 
L (wo) = 20 1g R (w) = 20 Ig X, + 20 Ig R, (w). (3.77) 


Comme argument de la fonction ZL (w) on adopte 1g (o). 
Si l’argument de la fonction 


Ÿ (Ig ©) = 14 (wo) = arg G(iw) (0 < w << oc), 
est 1g (w), on l’appelle réponse en phase logarithmique. 


La grandeur 20 Ig R (w) traduit le ue du système en décibels, unités RL A 
tées en acoustique (1 décibel — 0,1 bel). Le gain qui augmente de 104 fois la 
puissance du signal est égal à qg bels. La puissance du signal est proportionnelle 
au carré de son amplitude. Soit, par exemple, L (w,) = 20 1g R (w1) = 40 dé- 
cibels. Dans ces conditions, 1g R (1) = 2, R (w1) — 10? = 100. La puissance 
du signal s'est accrue de 100% — 104 fois, ce qui correspond au gain d’amplifi- 
cation de 4 bels. Pour construire la courbe de la fonction L (w), on porte en 


abscisses les valeurs de 1g w et en ordonnées les valeurs de la fonction L (w)en 
décibels. 


Pour construire la courbe de la fonction Ÿ (w). on porteen abscisses les va- 
leurs de 1g w, et en ordonnées, les valeurs de 1h (w) en radians. 

Comme unité de longueur en abscisses on utilise les unités logarithmiques, 
octave et décade. On dit octave pour un segment de l’axe 1g w compris entre 


&1 et 2w,. On voit aisément que la longueur de ce segment ne dépend pas de 
la valeur de «; 


loct = 18 20 — 1g wo = 1g 2 + 1g 1 — Ig 1 = Ig 2. 


On dit décade pour un segment de l'axe Ig w compris entre &, et 10ux. 
La longueur de la décade ne dépend pas de w,: 


lace = 18 1001 — Ig 1 = Ig 10 + Ig 1 — Ig 1 = 1. 


9. Détermination de la stabilité d’un système en boucle fermée 
d’après les courbes logarithmiques d’un système en boucle ouverte. 
La disposition relative des réponses en amplitude et en phase d’un 
système en boucle ouverte permet de juger de la stabilité d'un système 
en boucle fermée. Les figures 3.10 à 3.12 représentent les lieux de 
transfert et les réponses logarithmiques, en amplitude et en phase, 
des systèmes en boucle ouverte stables. Ces dessins montrent que les 
lieux de transfert (lieux de Nyquist) des figures 3.10 et 3.11 sont 
stables à l'état bouclé. Le système représenté sur la figure 3.12 est 
instable à l’état bouclé. 

On voit sans peine que pour qu’un système en boucle fermée soit 
stable, s’il l’est en boucle ouverte, il faut que dans la plage des 
fréquences où la réponse en amplitude logarithmique est positive 
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(c'est-à-dire où À (w) > 1) les nombres de passages par la ligne p — 
— —x de la réponse en phase dans le sens positif (de haut en bas) 
et dans le sens négatif (de bas en haut) soient égaux. 


Fig. 3.12 


Le critère que nous venons de décrire pour déterminer la stabilité 
d’un système en boucle fermée d’après les réponses logarithmiques 
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en boucle ouverte peut être généralisé au cas où la fonction de trans- 
fert du système en boucle ouverte G (p) possède des pôles sur l’axe 
imaginaire et dans le demi-plan droit de la variable complexe p [691]. 


$ 4. Fonction de poids et réponse unitaire d’un 
système linéaire stationnaire 


1. Système commandé monovariable. On appelle systèmes linéaires 
stationnaires les systèmes décrits par des équations différentielles 
linéaires à coefficients constants. Dans ce qui suit nous traiterons des 
systèmes en boucle fermée. Soit l'équation différentielle d’un système 
en boucle fermée 


1 (D) z = 1 (D) z (0. (4.1) 


Ici x est la fonction cherchée (signal de sortie), z (t), la fonction de 
temps donnée (signal d’entrée) ; f (D) et Z (D) les polynômes de l’opé- 
rateur de différentiation D: 


f (D)= aoD"+mD" +... +ansD+a, | 
L(D)= loD" + Dr + + Ina D + ln. 
Les coefficients des polynômes (2) sont supposés constants. De plus, 


on admet que m << n. Pour résoudre l'équation différentielle (1), 


on peut appliquer les méthodes du calcul opérationnel. Introduisons 
les notations 


(4.2) 


C(p)æz(t), Ep) zx (8. (4.3) 
La transformée de ue étant 
dth 
D'z <- p'E (p)— px (0) — px (0) — 
— prk-0 (0)= p'E (p) — pre. Le RE 2 (0), (4.4) 


les expressions différentielles linéaires f (D) x à et Z(D)z(t) ont 
pour transformées 


F)e 0 + F0) EG) — PQ) | .. 
L (D) 2 (9 + L(p) & (p) — PP (p), | 
où 
Q(p)= LP D > (). | 
- (ä.6) 
P(p}= PE (= z (0). 
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L'opérateur D, qui intervient dans les expressions (4) et (6) est 
déterminé par la relation 


Dèz (0)=[ TE 1. (4.7) 


dth 


D'après (5), à l'équation différentielle (1) correspond la transforma- 
tion suivante 


f @) Ep) = PQ GE) — P (P)1 + 1(p) & (P). (4.8) 


On en tire que 


Q (p)—P (p) LP) 
E (p) = US LS US C (p). (4.9) 


En adoptant pour la fonction de transfert du système (1) la 
notation 


__ L(D) 
D(D)=- (4.10) 
on peut mettre l'expression (9) sous la forme: 
— P 
E(p)= pBEL + © (p)& (p). (4.11) 


Désignons maintenant par M (t) et N (t) les originaux des transfor- 
mées suivantes : 


—P 
p BEC E à M (, (4.12) 
PO (p) -> N (+). (4.13) 


Etant donné qu'en vertu de l'hypothèse ci-dessus suivant laquelle 
le degré du polynôme ! (p) est inférieur à celui du polynôme f (p) 


les fonctions [Q (p) — P (p)V/f (p) et Op) = I (p)/f (p) sont des 
fractions MS les originaux M (t) et N (t) sont de la forme 


Lg 9 \to-! Q(p)—P (») L 
MO= > an [(t+ 37) en da 
: Act 

j — NE LS 371! L(p) 4: 
: (4) = À (4a—1)! L(E+ 75) fa (P) P=hg (4.35) 
Nous avons désigné ici par s le nombre de racines distinctes À, de 

l'équation caractéristique 

fG) = 0, (4.16) 
par q, l’ordre de multiplicité de la racine À, et par f, (p) la fonction 
fa(p}= 1. (4.17) 


(P— a)" 
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Il se peut que l'équation caractéristique (16) comporte des racines 
réelles et des racines complexes. Puisque les coefficients des polynô- 
mes (2) sont réels, les racines complexes de l'équation (16) forment 
des couples conjugués. Pour cette raison les fonctions M (t) et N (t) 
ne peuvent prendre que des valeurs réelles et dans le cas où l’équa- 
tion (16) possède des racines complexes, les fonctions M (t) et iV (t) 
peuvent être ramenées à une forme réelle explicite; mais nous n'’al- 
lons pas nous attarder sur ce fait [17]. 

En vertu du théorème de multiplication des transformées 


t 


+ PO (P) E (P) + | N (t— u) z (u) du. (4.18) 


Ainsi, d’après (11), (12) et (18), les conditions initiales x (0), 


z (0), ..., x"-! (0) étant données, la loi du mouvement du système 
décrit par l’équation (1) 


t 
z()=M (+ N(t—u) 3 (u) du. (4.19) 
0 


On peut en déduire également la loi de variation dans le temps 


d’autres coordonnées de phase du système: x (t),x(t), ..., x"”? (4). 
D'une façon analogue à l'exposé du $ 1 (formule (1.31)), nous 
appellerons la fonction W (t), définie ici par la relation opérationnel- 
le (13), fonction de poids du système monovariable décrit par l’équa- 
tion différentielle scalaire (1). 
Considérons maintenant l'interprétation physique de la fonction 
N (t). Soit 
z (t) = à (1), (4.20) 


c'est-à-dire on applique à l'entrée du système la fonction impulsion 
de Dirac. L'’équation (1) se met alors sous la forme 


f(D)z=1(D)6 (t). (4.21) 

Puisqu'à l'original 
L (D) 8 (€) = Lo (6) + H607-0 () +. + Lm-10 (1) + Im6 (€) 
correspond la transformée 
opt + Up" +... + np + lmP = PL(P), 

c'est-à-dire 

L (D) 6 (t) <- pl (p), (4.22) 
alors en tenant compte qu'en vertu de (5) 


f(D) z(t) < f (p) Ë Cp) — PQ (p), 
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on trouve qu’à l'équation différentielle (21) correspond la trans- 
formation 


f (p) ë GE) = PQ Gp) + pl (). (4.23) 
L'équation (23) entraîne que 
E(P)=p D + PO (p), (4.24) 


du fait que d’après (10) © (p) = L (p}/f (p). Dans les conditions 
initiales nulles 


z(0) —0, r(0)—0,..., rr-b (0) — 0 (4.25) 
on a d’après (4) et (6) 


Q (p) = 0. 
Ainsi, dans les conditions initiales nulles, l'expression (24) s'écrit 
& (p) = po (p). (4.26) 
Compte tenu de la relation opérationnelle (13), on a 
z(t) = N (+). (4.27) 


Ainsi, la fonction de poids À (t) est une loi du mouvement du sys- 
tème dans les conditions initiales nulles sous l'effet de la fonction 
impulsion de Dirac 6 (£). Notons maintenant qu’en vertu du théorème 
de la construction de l'original d’après sa transformée, la relation 
opérationnelle (13), qui a servi à déterminer la fonction (+), 
ne définit cette fonction que pour t{ => 0. Par suite l’expression (15) 
qui définit la fonction W (ft) n’a lieu que pour t > 0. Comme d’après 
(25) pour t << 0 le système était en équilibre, nous devons adopter 
en vertu de (27) que 


N (t) = 0 pour t < 0. (4.28) 
Pour trouver une autre caractéristique dynamique importante 


d’un système, dite réponse unitaire, considérons le cas où le signal 
d'entrée est une fonction échelon unitaire 


z(t) = 1 (1). (4.29) 
L'équation différentielle initiale (1) s'écrit 
f(D)z=1(D)i (t). (4.30) 


A l'original 
L(D) 1 (4) = Lo D (8) + D Ôm (8) +... + In10 (€) + Emi (t) 
correspond la transformée 
LP" + pi +  o. + lm1P + lm = L(p), (4.31) 


L (D) 1 (9 + L(p). (4.32) 


c'est-à-dire 


4—0393 
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Les relations (32) et (5) entraînent qu'à l’équation différentielle (30) 
correspond la transformation 


L f (p) E () = PQ (p) + 1 (p), (4.33) 
d'où 
__, Q() 

Dans les conditions initiales nulles (25), Q (p) = 0 et l'expression (34) 
se met sous la forme 

ë (p) = © (p). (4.35) 
Désignons par À (?) l'original dont la transformée est la fonction 

O (p) -> À (1). (4.36) 
La relation (35) entraîne 

x (t) = À (t). (4.37) 


De cette façon, la fonction À (t) définie par la relation opérationnel- 
le (36) est la loi du mouvement du système dans les conditions 
initiales nulles sous l’effet de la fonction échelon unitaire 1 (#). 
La fonction À (t) s'appelle réponse unitaire du système. 
Cherchons maintenant la relation entre la réponse unitaire et la 
fonction de poids. Remarquons que puisque le degré du polynôme 
L (p) est inférieur au degré du polynôme f (p), il vient 


. us EC) 
0 EL 7 0) 


D'après le théorème sur la valeur initiale de l'original 
A (0) = lim © (p) 
P—co 


et d’après (38) 


A (0)=0. 
La transformée de la dérivée de la fonction À (t) 
À (#)< p1O (p)—A(0)= PO (p) (4.39) 


se confond avec la transformée (13) de la fonction AV (t). Ainsi, la 
fonction de poids W (t) et la réponse unitaire À (t) sont liées par la 
relation 


A (tb = N (à). (4.40) 


Cherchons maintenant l'expression explicite de la fonction À (+). 
A cet effet mettons la transformée de la fonction À (£) sous la forme 
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d’une somme de fractions élémentaires. Puisque 


1(p)__ 1(0) 1 
pftp)  f(0) PT 


s To”? g-P-1 
CAS L'(p) 1 
+ 2 à 7 ET met po-P-1 Pia?) Ip=As (p—Ao)T! UE) 


la décomposition de la fonction © (p) en une somme de fractions 
élémentaires s'écrit 


l __ dL(0 


—F@) 10) 
s Ti Qs-p-1 
1 CA L'(p) 
+ à à (da —p—1)l L Opag-P-1  pfa(p) Jp=h re + (4.42) 
Etant donné que 
kot 
P _ the 
APT PT 9) 
on a l'original de la transformée (42) 
À t g—-p-1I 
= 0) pd D, (Ph 
1027 + d: nl Feet Loc T 6 (5 pos 
(4.44) 
On vérifie aisément que 
To! 
1° gto7P71 1 8 \ag=! 
À P! (qo —p—1)! apte” Pi  (4a—1)! (t+35) (4-45) 


et par suite l’expression (44) de la réponse unitaire peut se mettre 
sous la forme 


L (0) 2 L (p) 
10e R+ Dr [+ Var (49 


PÎa (P) 


D'après ce qui vient d’être dit, on peut conclure que pour un 
système commandé, la fonction de transfert ® (D), la fonction de 
poids W (t) et la réponse unitaire À (#) sont les caractéristiques dyna- 
miques principales, équivalentes entre elles. 

2. Système commandé monovariable à fonction de transfert sous 
forme de fraction irrégulière. Considérons maintenant le système 


&e 
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décrit par l'équation différentielle scalaire 


| f (D) z (9 = r (D) z (0, (4.47) 
où 
f (D) = &D" + a+... +an1D + an; (G.48 
r (D) = boD1+ bi D. + boD + ba 9) 
et de plus, qg > nr. 
La fonction de transfert du système 
__r(D) 
O(D)=— D) (4.49) 


peut être mise sous la forme 
® (D) = S (D) + v (D), (4.50) 
où S (D) est la partie entière de la fraction rationnelle r (D})/f (D) 
(c’est-à-dire un certain polynôme en D), et v (D) la fraction régulière 
qui s'obtient en séparant de r (D)/f (D) la partie entière. 
En utilisant les mêmes notations que dans (5) 


E(P)æz(), Cp) 2(), 


on a 
f(D)z(t)<f(p)E(p)— PQ (p), 
r(D)z(t)<r(p)6(p)—pL(p), | (4.51) 

où 

Q (p) = RPC) z (0), 
r ( ou (4.92) 
L(p}= 7 (0). 


En vertu de (51) on a la transformation 


f @) ë G) = p IQ GE) — L'P)1 + r (p) & (P). (4.53) 


On en tire 


— L 
E(p) = p Bt) + EE (p). (4.54) 


Il est facile de voir que la fonction T5 [Q (p) — L (p)l est égale- 

ment une fraction irrégulière. En effet, d’après (52), on a 

Q(P)—L(p) _ _f(p)z(0)—f (Do) z (0)—r (p)2(0)+r (Do)z (0). (4.55) 
f (p) f(p) (p— Do) 

Puisque d’après (49) et (50) 


r(p) = f() S ) + f () v (pb), (4.56) 
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l'expression (55) peut alors être ramenée à la forme 


Q(p)—L(p) ____ S(p)—S (Do) 1 f (p)— f (Do) _ 
f (P) v (P) —f (Do) v (Do) 
— 8 (Do) 2 (0) — PP 2 (0) }- (4.57) 


Le premier terme du second membre de (57) est une fonction entière 
(polynôme en p). Le deuxième terme est une fonction rationnelle 
de p, qui est de plus une fraction régulière. Comme f (p) v (p) est un 
polynôme en p, on élimine le dénominateur p — D, dans le deuxième 
terme du second membre de l’expression (57). 

L'expression (57) pourra alors s’écrire : 


| LUE —R(p)+4(p), (4.58) 
avec 
S (p)—S (D 
R (p) = BD > (0), (4.59) 


et u (p) est une fraction régulière déterminée par le deuxième terme 
du second membre de (57). 
La fonction u (p) peut être mise sous la forme d’une somme des 


fractions élémentaires [17]: ° 
s 07° Ig-P-! 
1 m 99 
RUE à 2 pi LT * 
Q(P)—L (p) ! 
é Îa (P) =Àg (P—Xo)PT! : (4.60) 


L'original dont la transformée est la fonction pu (p) est noté M® (t): 
pu Gp) - M® (1). (4.61) 


Compte tenu de la relation (45), mettons la fonction M* (t) sous 
la forme 


u dot 
(p= 9-2 [fr 8 Vo! Q)—L (p) 
# o= 2 (go — 1)! [(: 7) fa (p) ER Se, 


Si l’on applique (58) et (50), l'expression (54) qui définit la fonction 
E (p) peut également s’écrire 


EG) =pu(p) +S(pP)56p)—PpR(p)+v(p)E(p). (4.63) 
En tenant compte de la relation (59) on trouve 


S (P)G Gp) — PR (p) + S (D) z (+). (4.64) 
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Désignons l'original de la transformée pv(p) par N* (t): 


Pv() > N* (+). (4.65) 
D'une façon analogue à (62), la fonction W* (t) est de la forme: 
N*(t)— Se [a+ Ye r (p) . (4.66) 
_ (go —1)! op fo (P) Jr=A, | 
Comme 
t 
+ pv(p) Ep) | Ne (tu) z(u)du, (4.67) 
0 


en vertu de (63) la loi du mouvement du système régi par l'équation 
(47) s'écrit 


t 
z(t)=M"* E)+S(D):0+ | N°(t—u)z(u)du. (4.68) 
0 


Examinons maintenant l'équation différentielle scalaire 
f(D)z(t) =r(D)ô(), (&.69) 


où Ô (t) st la fonction impulsion de Dirac. 
D'une façon analogue à (22) 


r (D) 6 (t) <- pr (p). (4.70) 
Puisque d'après (54) 
f (D) z (t) + f Gp) Ë GP) — pQ (); 
à l'équation différentielle (69) correspond la transformation 


f @) Ë GE) = pQ GE) + pr), (4.71) 
ou 
= + PTE 4 


Conformément, à (49) et (50), l'expression (72) peut s'écrire 


E(p)=p TP + PS (p)+ pv (p) (4.73) 
Dans les conditions initiales nulles 
: n—1 
z(0)=0, z(0)=0, ...,zx(0)=0 (4.74) 


la fonction Q (p) s’annule en vertu de (4) et (6) 
QG) = 0, 
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et l’expression (73) devient 

ë (p) = pO;(p), (4.75) 

D G) = S (p) + v E). 
S(p) étant un polynôme en p, il vient 
pS (p) -> S (D) 6 (t). (4.76) 

Si l’on tient compte encore de la relation (65) 

pv Gp) + N° (, 
on trouve qu'à la transformée pO (p) correspond l'original 


où, d’après (50), 


pO (p) + Æ (+), (4.77) 
avec 
K ( = S(D)6(t) + N* (+). (4.78) 
En vertu de (75) et (77) 
z(t) = K (t). (4.79) 


Ainsi, la fonction X (t) est la loi du mouvement réalisé par un 
système commandé dans les conditions initiales nulles sous l'effet 
de la fonction impulsion de Dirac à (+). 

La fonction XÆ (t) déterminée par la relation opérationnelle (77) 
peut s’appeller fonction de poids du système commandé monovariable 
décrit par l'équation différentielle scalaire (47). 

De même qu’au point 1, l'expression (78) ne détermine la fonction 
Æ (t) que pour t > 0. Etant donné qu'avec £ << 0 le système était en 
équilibre, en vertu de (79) nous devons adopter que 


K (t) = 0 pour t << 0. (4.80) 
Considérons maintenant l'équation 
f(D)z(t) =r(D)i (+). (4.81) 


D'une façon analogue à (32) 
r(D)1(t) < r (p). 


En tenant compte de la relation (51), on obtient la transformation 


f @) £ G) = pQ GE) +r), (4.82) 
qui correspond à l'équation différentielle (81), d'où 
_nQ{(?) 4, r() 
ou, en vertu de (49) et (50), 
Q (p) 


E(p)=p ft +9 ()+v(p). (4.84) 
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Sous les conditions initiales nulles (74) 


: n — 1 
z(0)=0, z(0)—0, ..., z(0) — 
la fonction Q (p) = 0 et l'expression (84) se met sous la forme 


ë (p) = © (p), (4.85) 
D (p) = S (p) + v (p). 


La fonction $S (p) est un polynôme en p, et par conséquent, 


où d'après (50), 


S (p) -> S (D)1 (+). (4.86) 

Désignons par A* (t) l'original dont la transformée est la fonction 
v (p): 

v (p) > A* (1). (4.87) 


En vertu de (46) et _ la fonction A* (ti) s'écrit 


Li _r(0) 4! r (p) L RQ 
AO = f (0) + Du = cr [| STE ôp F Pfa (P) La is 


Ainsi, à la OT NS O (p) correspond l'original 


O (p) -> U (+), (4.89) 
avec 
U (t) = S (D)1 (t) + A* (+). (4.90) 
Conformément à (85) et (89), 
z( = U (b), (4.91) 


et, par suite, la fonction U (t) est la loi du mouvement du système 
commandé dans les conditions initiales nulles sous l’effet de l’éche- 
lon unitaire 1 (t). 

La fonction U (t) déterminée par la relation opérationnelle (89), 
peut s'appeler réponse .unitaire d’un système monovariable décrit 
par l'équation différentielle scalaire (47). 

Notons que puisque v (p) est une fraction régulière, lim v (p) = 

DPD—00 


= 0, et, par conséquent, À * (0) — 0. C'est pourquoi 


À* (t) <- p lv (p) — A* (0)] = pv (p). (4.92) 
Si l’on retient encore que 
= 1S(D)1 (91= 8 (D) 8 (8) < ps (p), (4.93) 


on à 


Ü (+ pS (p) + pv (p) = p® (p), (4.94) 
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ce qui coïncide avec la transformée (77) de la fonction X (t). On en 
déduit une liaison analogue à la relation (40) entre la fonction de 
poids Æ (té) et la réponse unitaire U (t): 


Ü (t) = K (#. (4.95) 


Exemple. Examinons à titre d'exemple le système décrit par l'équa- 
tion différentielle 


(D+1)z=(D2+D+1)3z(t). (4.96) 
Ici 
f(D)}=D+1, r(D)=D3+D+#1, 
r (D) 
f(D) 


S(D)= D, v(D)=-—— 


®(D)= =S$ (D) +v(D)= 


1 
+5: 


_f(p)—f(Do) … 
Q ED, z (0) = zx (0), 


—r(D 2 _—D:—-D 
Lo) = PERL à (0) = EE TÈR à (0) = (p+ Do 1) 2 (0). 


QP)—L(p) _ _2(0)—(p+Do+1)z(0)_ z (0) —: (0) 
R(p=2 (0, pp QT, pu (p) 7 Me (P), 


M®(t)={z(0)—z(0)Je-t, pvp) Ne (Ne (t=et. 
D'après l'expression (68), la solution de l'équation (96) est 


[4 
z(t)=[z(0)—2(0)]e-t+z (t) + | e-({-u)z (u) du. (4.97) 
0 


En vertu de (78), la fonction de poids du système X (t) s'écrit 
K (= S(D)ô(t) + N° (1. 
Pour le système décrit par l'équation différentielle (96) la fonction (t) se met 
sous la forme 
K(D=ô(t)+1()e-t. (4.98) 
Le facteur 1 Le est introduit dans l’expression (98) pour expliciter le fait 
qu'avec t < 0, K (t) = 0. 


3. Systèmes commandés multivariables. a) Loi du mouve- 
ment d'un système multivariable. Considérons 
maintenant un système en boucle fermée décrit par l'équation diffé- 
rentielle vectorielle 


fD)z( =r(D)z(#. (4.99) 
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Ici x (t) est le vecteur de dimension »# dont les éléments sont les 
fonctions recherchées, et z (4), le vecteur de dimension m dont les 
éléments sont les fonctions du temps données: 


ZT! (£) Z{ (#) 
c@=| 20, :6= | ni | (4.100) 
Zn (t) Zm (£) 


Les matirices f (D) et r (D) sont des matrices polynomiales dont 
la variable est l’opérateur de différentiation D = d/dt: 


f11 (D) ... fin (D) 
ra-| nine | 
fn (D) re fnn (D) 
k (D) ... rim(D) 
Re | . (4.101) 
Tn1 (D) ... rnm (D) 
Les coefficients des polynômes f;, (D) et r;, (D) sont supposés cons- 
tants. 


L'équation vectorielle (99) est équivalente au système des équa- 
tions scalaires 


21 fn (D) zx (6) = À ru (D) Zu (0) 
(=1,...,n). (4.102) 


Désignons par v, l’ordre de la dérivée supérieure par rapport à 


zn (& = 1, ...,n) qu’on trouve dans les équations (102). Le 
rang p du système (102) est 


D ES, bi. Lu. (4.103) 


Supposons que vx > 1 (k = 1, ..., n) et que le déterminant consti- 


tué par les coefficients affectés aux 20) (k = 1, ..., n) de l’équa- 


tion (102) est différent du zéro. Sous cette Oudition, le degré du 
déterminant À (D) de la matrice f (D) est égal au rang du système p. 
D'après ces hypothèses, les valeurs initiales 


: VR —1 
zn (0), za (0), ..., 2 (0) (k=1,...,n) 


ne sont liées entre elles par aucune relation et peuvent être données 
arbitrairement. 
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Si l'on désigne par F (D) la matrice adjointe de la matrice f (D), 
l'équation (99) peut se mettre sous la forme 


| z(=D(D)z(t), (4.104) 
ou 
O(D)= OPEL. (4.105) 


La fonction © (D) est la matrice de transfert du système décrit par 
l'équation (99). 

Supposons pour la généralité que la fonction ® (D) est une frac- 
tion irrégulière ; désignons par S (D) sa partie entière et par v (D) 
la fraction régulière qui s'obtient en séparant cette partie entière de 
O (D). Ainsi 

®(D)= PAT = S (D)+v(D). (4.406) 

Dans ce qui suit nous aurons besoin d'une relation qui s'obtient 
de la façon suivante. En multipliant à gauche le premier et le second 
membre de (106) par la matrice f (D) et en tenant compte du fait 
que f (D) F (D) = EA (D), où E est la matrice unité, on a 

r (D) = f(D)S (D) + f (D) v (D). (4.107) 
Comme r (D) et f (D) S (D) sont des fonctions entières (polynômes 


en D), (107) entraîne que f (D) v (D) est une fonction entière (poly- 
nôme en 


Cherchons maintenant la solution de l'équation (99). Introduisons 


les notations 

E(p)-zxz(t), &(p) + 2(). (4.108) 
En vertu de la relation opérationnelle (4), les transformées des 
expressions différentielles linéaires vectorielles f (D)z (t) et r (D) z(t) 


sont 
f(D)z(t)< f (p)5 (p) — PQ (p), 
r (D)2(#)< r (p) EP) — PL (p), A 
où Q(p) et L(p) sont des vecteurs qui s'écrivent 
Qp)= EC à (0), 
r (p)—r (Do) 00) 
L (p)= D z (0). 


La transformation qui correspond à l'équation différentielle (99) 
est la suivante: 


f@EÈ@=P(Q@)—-LEPI+rE)E(), (4111) 


d’où l’on tire 
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Transformons maintenant le premier terme du second membre de la 
relation (112). En remplaçant Q (p) et L (p) par leurs expressions 
(110), on obtient après des transformations assez simples 


F (p)[Q@(p)—L(p}]_ ___ S(p}—S (Do) 
A (p) HE P— Do AE 
F(p) ff(p)—} (Do) [F-1 (p) A(p)—F-1(D5) A (Do)}S (Do) 
RG De OÙ 


F-1 (p) A (p) v (p)} —F-1 (Do) A (Do) v (Do) 
— BABA TC RCD CN. ; (0)}. (4.113) 


En retenant que F (p) f (p) = EA (p) et, par suite, 
F7 (p) A (p) = f @), 
l'expression (113) peut être mise sous la forme: 


F(p)[Q@(p)—L(p)]_____ S(r)— =) 


à () = Er og 
F —f(D 
+2 PET BEC (2 (0) —S (De) 2 (0)1— 
__f{ (p) v Cp) —f (Do) v (Do) 
RSS z (0) } . (4.114) 


Le premier terme du second membre de l'expression (114) est une 
fonction entière (polynôme matriciel en p), alors que le deuxième 
terme est une fonction rationnelle de p, qui est en plus une fraction 
régulière. Constatons que puisque f (p) v (p) est une fonction entière 
(polynôme matriciel en p), comme on l’a vu plus haut (107), le 
dénominateur p — D, du deuxième terme du second membre de l’ex- 
pression (114) se simplifie par p — D,. 

L'expression (114) peut donc s’écrire 


FPE EAN = —R(p)+u(p), (4.115) 

avec 
S(p)—S (D : 
R(p) = 2e. z (0), (4.116) 


alors que LL (p) est une fraction régulière déterminée par le deuxième 
terme du second membre de l’expression (114). Introduisons la nota- 
tion M (t) pour l'original dont la transformée est la fonction pu (p): 


pu (p) > M (). (4.117) 


Dans ce qui suit nous aurons besoin encore de la transformation 
suivante. Le déterminant A (p) de la matrice f (p) peut être mis sous 
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la forme 
A (P)= koTn (P); (4.118) 


Ta(p}=(p— My... (p—a)e= [[ (p— A0). (4.119) 


Ainsi, À, sont les zéros du polynôme À (p), et q, leurs ordres de multi- 
plicité. 

Soit Z%_, (p) le plus grand diviseur commun des mineurs d'ordre 
(n — 1) de la matrice f (p), et &, le coefficient affecté au plus grand 
degré de p du polynôme %3., (p). Désignons par %,., (p) le poly- 
nôme suivant : 


PT 
Dn-1 = Ln-1 (p)- 


Ce polynôme est un diviseur déterminant d'ordre (7 — 1) de la 
matrice polynomiale f (p). 
On sait (17, 21] que la fonction 


Ta ; 
Ln (D = 7 (4.120) 
est un polynôme de la forme 


La (D) = (p— ms 2 (p—a)"e = Î] (p— As)", 


en outre 
1< Mo Go- (4.121) 


De cette façon les zéros du polynôme Z, (p) coïncident avec les 
zéros du polynôme A (p), alors que les multiplicités des zéros du 
polynôme £, (p) vérifient la condition (121). Le polynôme Z, (p) 
est un facteur invariant supérieur de la matrice jf (p), alors que les 
binômes (p — À,)-0 sont des diviseurs élémentaires supérieurs de 
cette matrice. 

Avec (118) et (120), on a 


À (p) = koZn-1 (P) £n (P)- 


Les éléments de la matrice F (p) étant des cofacteurs des éléments 
du déterminant de la matrice f (p), tous les éléments F,, (p) de la 
matrice F (p) sont divisibles par le polynôme Z,-, (p) et pour la 
matrice F (p) on peut écrire 


FE) = F ) Zr-1()- 


La matrice 5 (p) est donc une matrice polynomiale. 
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Des relations obtenues ici il ressort que 
F(p) __Æ(p) 
At) — AG) ? (K129) 
avec 


A(p)= ko£n (D), 


c'est-à-dire 
A (p)}= ko(p— 4)" ... (p—h)"e = ko I (p—Ao)"s. (4.123) 


Cherchons maintenant la fonction M (t) qui en vertu de (117) 
est l’original de la transformée pu (p). A cet effet, en vertu de (122), 
remplaçons dans l'expression (145) F (p)/A (p) par # (p)/A (p). 
La fonction M (t) devient alors 


à’ 
MQ= Zn [+25] 


Mar! 


K < EEE (4.124) 


Ao (P) 


Ici s est le nombre de zéros distincts À, du polynôme A (p) qui ne se 
confondent pas; m,, la multiplicité du zéro À, et À, (p), la fonction 
Ao(p}=— D. (4.125) 

(P—Ào) © 


La fonction M (t) est un vecteur de dimension ». 
En appliquant (115) et (106) l'expression (112) qui détermine la 
fonction E (p) peut se mettre sous la forme 


&(p) =paG@)+SG@)iœ@)—pREP)+v(HpP)C(G). (4.126) 


Compte tenu de la relation (116), on trouve que 


S @) 6) — PRG) +5 (D) z (+). (4.127) 


Il résulte de l'exposé précédent que S (D) est une matrice polyno- 
miale x xX m dont la variable est l'opérateur de différentiation 
D = d/dt. Désignons par N (t) l'original de la transformée pv (p): 


pv (p) > N (+). (4.128) 
D'une façon analogue à (124), la fonction W (t) s'écrit 
8 À { 
Sn ue _5_\"o"! F(pr(P) 
vez (mo—1)! L(E+ ôp ) As (p) (#:229) 


P=hg 
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Cette fonction est une matrice rectangulaire x X m. Comme d'après 
le théorème de multiplication des transformées 


t 


_ pv (p) &(p) => | N(t—u)z(u) du, (4.130) 


0 


la loi du mouvement d’un système décrit par l'équation différentielle 
vectorielle (99) est 


{ 
zO—=M(D+S(D)z(é + ( N(t—u)z(u) du. (4131) 
0 


Les éléments zx; (t) du vecteur zx (t) seront 


m !? 

23 (9) = My (0 + S Sy(D)m + D | Niutt—u)z(u)du (4.182) 
TES À U=1 0 
(= : °, n). 


b) Matrice de poids. La matrice de transfert du sys- 
tème ® (D) est déterminée plus haut par l'expression (106). La fonc- 
tion © (D) est une matrice zXm. D'après (106), l'élément ®, (p) 
de la matrice © (p) s'écrit 


D Fin (P) rs (P) 
Dye(P)= 5 —=Sn(p)+va(p), (4.138) 


où S;, (p) est un polynôme en p et v;, (p), une fraction régulière 
obtenue en séparant la partie entière delO,, (p) 
Soient maintenant les éléments du vecteur z (t) du second membre 
de l'équation vectorielle (99) 
Z (4) = 8 (1), z3(0 =0, (g=1,2,..., s—1,s+1,..., m), 
(4.134) 


où 6 (t) est la fonction impulsion de Dirac. Sous la condition (134), 
le vecteur r (D) z (t) est de la forme: 


ra(D)2(7T (ri(D)6() 
: (D) z(D = los (D) Zs (ë) e Tos (D) Ô(t) | (4.135) 


Tns (D) Zs (£) Tns (D) Ô (£) 
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D'une façon analogue à (22), la transformée de la matrice (135) 
s'écrit 

ris (D) 6 (4) Pris (P) ris (P) 

T2s (D) 6 (t) Pres (P) 5 28 (P) | (4.136) 


Tns (D) 6 (t) _Prns (P) Tns(P) 


En introduisant les notations 


ris (P) 
10 RONA E (4.137) 
Tns (P) 
on trouve que si les éléments du vecteur z (f) sont de la forme (134), 
r (D) z (4) < pr (p). (4.138) 
Nous sommes ainsi dans le cas où la transformation (111) devient 
f (P) Ep) = PQ (p) + pr (p), (4.139) 
d’où l’on tire 
E(p=p A0 + D EGT (4.140) 


En tenant compte de (137), l'élément E; (p) du vecteur E (p) s'écrit 


2 FnŒ) Qu @) À Fin (P)rre (P) 
pr —=1 


Conformément à (133), on peut récrire l’expression (141) sous la 
forme 


(j=1,...,n). (4.141) 


D Fin (P) Or (P) 
BCP = Po + PS5 (P)+ pv (p) (j=1, -.., n). (4.142) 


D'après (110), dans les conditions initiales nulles 


: VR—1 
2n(0)=0, 2a(0)=0, ..., zx (0)=0 (k=1,...,n) (4.143) 
la matrice Q (p) s’annule 


Q ) = 0, (4.144) 


et l'expression (4.142) devient 
E(P) = PS js (P) + PVis (P) = PO; (p). (4.145) 
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65 
Etant donné que S,, (p) est un. polynôme en p, 
PS ja(P) + Sjs (D) 6 (t). (4.146) 
Si l’on retient encore que d’après (128) 
PVjs Cp) > Nis (4), (4.147) 


où V;, (t) est un élément de la matrice W (t) déterminée par l’expres- 
sion (129), on trouve qu'à la transformée pO,, (p) correspond l'ori- 


ginal 
PO;s (p) -> K js (£), (4.148) 

avec 
K js (t) = Sjs (D) 8 (8) + NV (1). (4.149) 
La matrice W (f) a été déterminée précédemment par l'expression 


(129). En ramenant l'expression de l'élément W;, (t) de cette matrice 
à la forme réelle, on a 


. »« D F jn (P) rhs (P) 
N DEN 9 \"e tri 
QU =, Men! (+4) no be 
cu ent 
+2 5 qi (Re £ cos @xt — Im £ sin œt], (4.150) 
=: s°+ 


où 


CE 


le 


à F jx (P) rhs (P) | 
£ "= p=E}+i0,} ° 


Ath (P) 


Ici s’ est le nombre de racines réelles x, de l'équation A (p) = 0, 
où À (p) est de la forme (123), qui ne coincident pas; s”, le nombre 
de couples de racines complexes e; + iw, de cette équation qui ne 
coincident pas non plus. Par m, et m,+, nous avons désigné la multi- 
plicité de ces racines et par A, (p) et A,:+2 (p), les fonctions 


A (p) | À (p) 
AGP) ——— Asp) = —"" ——. 4.151 
' (P—%xg) 6 (p—en—iwn) *+# 
D'après (145) et (148) 
tt) = Ky (0 G—=1,...,n). (4.152) 


Ainsi, la fonction X,, (t) (j = 1, ..., n; s fixé), dans les condi- 
tions initiales nulles est une loi de variation dans le temps de la 
coordonnée z; du système dans le cas où tous les éléments du signal 


5—03%3 
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d’entrée vectoriel z (t) sont identiquement nuls, sauf l’élément z, (t) 
qui vaut la fonction impulsion de Dirac 6 (4). 
La relation opérationnelle (148) entraîne 


p® (p) + Æ (+), (4.153) 


où Æ (f) est une matrice m X n, dont l'élément X,, (t) est défini 
par l'expression (149). 

La matrice X (t) définie par la relation opérationnelle (153) peut 
s'appeler matrice de poids du système multivariable décrit par l’équa- 
tion différentielle vectorielle (99). 

Conformément à (153), l'expression (149) ne définit la fonction 
K (t) que pour t > 0. Comme pour t << 0 le système était en équili- 
bre, nous devons adopter eu vertu de (152) 


K (t) = 0 pour 1 0. 


c) Matrice de transition. Considérons maintenant 
le cas où les éléments du vecteur z (£) sont de la forme 


Zz (0 =1(), z20=0 (g=1,2,...,s—1, s+1,..., m). 


(4.154) 
Sous la condition (154), le produit des matrices r (D) et z (t) s'écrit 
rs (D) z: (4) ris (D) 1 (4) 
De" 020 1e LreOIO CL (4155) 
Tns (D) Zs (4) rs (D)1 © 
On a pour la transformée du vecteur (155) 
ris (D) 1 (1) ris (P) 
ra (D) 1(09 À À rec) | (2.456) 
” (D)1  Lratp) 
c'est-à-dire . 
r(D)z(t)< r (p), (4.157) 


où le vecteur r (p) est défini par l'expression (137). Nous sommes 
ici dans le cas où la transformation (111) devient 


. { b) ë Cp) = pQ GE) +rG), (4.158) 


F F 
E()=p F0 LOT, (4.159) 
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Pour l'élément E; (p) du vecteur & (p) on a, compte tenu de (441), 


ñn 
Re Ÿ Fu (P) Qn CP)  Y\ Fin(p)rns(P) 
k=1 h=1 


&3(P)= D BE an (=1,...,n). (4.160) 


D'après (133), l'expression (160) peut s’écrire ainsi : 


2 F jr (p) Qn (P) 
SPP — + 15 (P) + vis (P). (4.161) 


Les conditions initiales (143) étant nulles, la matrice Q (p) s’annule 
et l'expression (161) devient 


3 OP) = Sie (P) + Vis p) = Di ) G—=1,2,...,n). (4.162) 
Puisque S;s (p) est un polynôme en p,on a 
S'js P) + S js (D) 1 (+). (4.163) 


Désignons par À (t) la matrice dont la transformée est la matrice 
v (p): 


v (p) => À (+). (4.164) 
D'une façon analogue à (88), il vient 


F (0)r (0) Jet Er 0 
AU=—G +5 (+4) PAo@) JP=2," (4:165) 


(164) entraîne que 
Vis @) + A; (4), (4.166) 
où la fonction À, (t) est un élément de la matrice À (t 


). 
D'une façon analogue à (150), l'expression de l'élément 4,, (4) 
de la matrice À (t) ramenée à une forme réelle est 


S Fr (0)rrs (0) 


À js (£) = — A (0) + 


s’ ee! gd \m _1 Frs Ÿ Fn (p) TRs (p) 
_—_—_— SR 
+2 (mg—1)! (#+ 5) PAg (Pb) pu, 
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Ùd F jn (P) ra (P) 


C7] 


0 \Ms+h=l R- 1 
X + 5) PA: 4n (P) — " Oh 


; à F jn (P) rhs (P) 
Mme’+ —_ — Q 
— Im (:+3) Ph Lasast ontf. (4.167) 


PA sn (P) 
Ainsi, à la transformée ®,, (p) correspond l'original 
| P;s (p) + Us (?), (4.168) 
: Ua (= 53 (D) À (9 + Ass (D. (4.469) 
En vertu de (162) et (168) 
zx; = UV, (D G—=1,...,n). (4.170) 


Ainsi, la fonction U;,,{(t) (j = 1, ..., n; s fixé) est une loi qui 
régit la variation dans le temps de la coordonnée x; du système dans 
les conditions initiales nulles pour le cas où tous les éléments du 
signal d'entrée vectoriel z ({) sont identiquement nuls, sauf z, (4) 
qui est égal à l'échelon unitaire 1 (4). 

La relation opérationnelle (168) entraîne 


@ (p) > U (?, (4.171) 


où U (t) est une matrice nm X n dont l'élément U, (t) est déterminé 
par l'expression (169). 

La matrice U (t), définie par la relation opérationnelle (171), 
peut être nommée matrice de transition d'un système de commande 
multivariable décrit par l'équation différentielle vectorielle (99). 

Notons que puisque tous les éléments de la matrite v(p) sont des 
fractions régulières, lim v(p) —0 et, par conséquent, À (0) — 0. Donc 

P —+ © 


À (9 < p [v (p) — À (0)1 = pv (p). (4.172) 
En tenant encore compte du fait que 

7 [S(D)1(91=S(D)8()< pS (p), (4.173) 
On à | 

U (t) <- pS (p) + pv (p) = p® (p), (4.174) 


ce qui coïncide avec la transformée (153) de la fonction X (t). On en 
déduit la relation suivante entre la matrice de poids À (4) et la matri- 
ce de transition U (t): 


Ü (t) = K (b). (4.175) 
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$ 5. Processus transitoires et stationnaires dans 
les systèmes commandés en boucle fermée 


1. Calcul de la fonction de poids d’après le lieu de transfert d’un 
système en boucle fermée. Au $ 4 nous avons introduit à l’aide des 
relations 


> Fjn (P) rha (P) 
PO = — À Ne (t), (5.1) 


n 
à, Fjn (P) rha (P) 


D je (P) = 57 — + A (t) (5.2) 


ia fonction de poids (4.148), (4.133) (qui s'appelle également réponse 
impulsionnelle) et la réponse unitaire (4.168). Nous supposerons ici 
que la fonction ©, (p) est une fraction régulière. En nous bornant 
aux systèmes stables nous devons poser que tous les zéros du polynôme 
À (p) se situent dans le demi-plan p gauche. C’est pourquoi tous les 
pôles de la fonction O;, (p) reposent dans ce demi-plan gauche. 

Si l’on connaît la fonction ®;, (p), alors la fonction de poids 
N,, (t) et la réponse unitaire À, (t) peuvent s’obtenir à l’aide de la 
formule de Riemann-Mellin. La relation (1) conduit à 


C+ioco 
1 Ê 
Nn(=5% | PEBertap (20) 


ou 
C+ io 


| Œu(petap (120). (5.3) 


C—10 


Le 
2ni 


N js (t) — 


Dans l'expression (3) l'intégrale est calculée le long d’une droite 
parallèle à l’axe imaginaire (menée à la distance c de cet axe), la 
grandeur c étant choisie de façon que tous les pôles de la fonction 
®;, (p) se trouvent à gauche de la droite envisagée. Tous les pôles 
de la fonction ®,, (p) se trouvant dans le demi-plan gauche, on peut 
poser c = (. 

Passons maintenant du plan de la variable complexe p dans le 
plan q où 


-p = iq. (5.4) 
La formule (4) amène 
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Ainsi, les relations 
= C — io, = —i(c — ioo) — —ic — oo, 
p=c+ioo, q—= —i(c + ico) = —ic + oo, 
sont vraies et l’expression (3) s'écrit 


—iC+oo 


Nnt=z À Dlig)eïitdg. (5.5) 
Puisque 
p=c+io, (5.6) 
on a 
g=—i(c+io) = —ic + ©. (5.7) 


Avec c = 0, l'expression (7) devient 
qg = ©. 


Par conséquent, en vertu de l’hypothèse avancée plus haut suivant 
laquelle le système concerné est stable, on peut poser c = 0 et rame- 
ner l’expression (5) à la forme 


NACEE { D, (iw) eivt do. (5.8) 


L'expression (5.8) est une transformation inverse de Fourier. Elle 
définit la fonction W;, (t) dans l'intervalle 0 << t << co, si seulement 


l'intégrale \ N;,(t) dt est absolument convergente. Pour un sys- 


tème stable cette condition est vérifiée. 
L'expression (8) peut s’écrire 


Ni) = { [Re O,, (io) cos wt — Im D}, (iv) sin wt] do + 


œ 


+ { [Re D; (iw) sin wt+ ImD;, (iw)cosot] du. (5.9) 


Les fonctions Re ®,, (iw) et cos wt sont des fonctions paires de «. 
Les fonctions Im ®;, (iw) et sin wt sont des fonctions impaires de ©. 
Donc la fonction sous le signe somme de la deuxième intégrale de 
l’expression (9) est une fonction impaire de w, et comme l'intégration 
s'effectue entre —o et +00, la deuxième intégrale de (9) s’annule. 
La fonction sous le signe somme de la première intégrale de (9) étant 
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une fonction paire de w, cette intégrale peut être remplacée par le 
double de cette intégrale prise dans les limites de O0 à oo. L'expression 
(9) s'écrit alors 


oo 


N (0 = + | Re ®, (iw) cos wt do — + | ImO,, (iw)sinwt do. (5.10) 
0 0 


La formule (10) permet ainsi de définir la fonction de poids W;, (t) 
du système d’après le lieu de transfert ©;, (iw) de 
ce système. 

Soit, maintenant, & — —7T. L'expression (8) 
devient alors 


iR 


Na(—d= { Oy(iw)e-it duo. (5.11) 
En revenant dans le plan p, on a en vertu 
de (6) 

Nu(—-9=5 | Ou(pe-rap. (512 
Puisque d’après l'hypothèse que nous venons : 
de faire ®,,(p) est une fraction régulière, Fig. 5.1 
sur le demi-cercle T de rayon ÆR (fig. 5.1) 
la fonction D}, (p), où p = Reï®, avec R —+ co, tend uniformément 


vers Zéro par rapport à @q, où — << P <+ . C’est pourquoi ce 
demi-cercle vérifie le lemme de Jordan 


lim _ | D(p)e-" dp=0. (5.13) 
r 


Le demi-cercle TL d'intégration dans l'expression (13) repose dans le 
demi-plan p droit du fait que pour p = Reï® c'est seulement dans 
le demi-cercle p droit que la fonction [e-Pt| — e-(Rept tend vers 
zéro avec À —> co. La relation (13) permet d'écrire l'expression 
(12) sous la forme 

Nn(—9=7 | Dutpe-rdp+lim 7 m [Su (Pre ” dp= 


= Djs(phe-"dp, (5.14) 
C 
où le contour fermé C est composé de l’axe imaginaire et d’un demi- 


cercle de rayon infiniment grand. Ce contour renferme tout le demi- 
plan droit. 
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L'intégrale du second membre de (14) est égale à la somme des 
résidus de la fonction ®;, (p) e-P* suivant les points singuliers de la 
fonction ®;, (p) situés dans le demi-plan p droit. Mais comme dans 
le demi-plan droit la fonction ®,,(p) ne possède aucun point sin- 
gulier, cette intégrale est nulle. Ainsi on obtient que 

N;, (—7) = 0. (5.15) 
Puisque d’après (10) 


N y (—7 = + | Re D (iw) cos ut du ++ | Im D, (iv) sin ot do, 
0 Û 


(5.16) 
conformément à (15) on a 


_ Î Re®,, (iu) cos ur du — —+ | Im; (iw)sinot dw. (5.17) 
0 0 


Enfin (17) et (10) conduisent à l’expression définitive de la fonction 
de poids 


N js(t) =< Re D; (iw) cos ot do = 


O2 8 


= —< | Im ®; (iw) sin ot dw pour £>0. (5.18) 
Ù 


2. Calcul de la réponse unitaire d’après le lieu de transfert d’un 
système en boucle fermée. Passons maintenant à la réponse unitaire 
A, (t). Puisque d’après (2) 


n 
N Fin (P)rhs (P) 


De (= — + A (6), (5.19) 
il vient 
; rs (p) 
Aps (t)= 5 | CHE ertdp (120). (5.20) 


Il est impossible d'appliquer directement à l'expression (20) 


les résultats obtenus ci-dessus du fait que la fonction HP = 


D Fjn(p}rra(p) 


nn possède en origine un pôle de premier ordre. 
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C'est pourquoi nous allons transformer cette fonction, et à cet effet, 
la développer en une somme de fractions élémentaires. En tenant 
compte des relations (4.122), on a 


D Fn(p)rns) D Fjn(p)rre (P) 


O js (P) RE — RS 
P PA (P) PA (p) 
Ÿ F ju (0) rns (0) RS mo! 
Rk=1 
Ca — pro diem 
o=1 p—=0 

Mo-P=t 2 F ju (P) ras (p) 

X m a”?- | A 7 à wp+li- (5.21) 
ôp 9° PAa (P) P=Àg (P— Ac)? 


Introduisons la notation W,, (p) pour le deuxième terme du second 
membre de (21). Ainsi, 


ÿ F jn (0) rra (0) 


js (P) P) 1 
= = — >; ss is (p) 
ou 
LD LD, (0) ++, (p). (5.22) 


W,, (p) est une fonction rationnelle dont tous les pôles se situent 
à gauche de l’axe imaginaire dans le plan de la variable complexe p. 
Puisque d’après (22) 


O 8 — O 8 0 
Ya p)= = UE (5.23) 
on écrira dans ce qui suit 
Djs &) _ Djs (0) , Os (p)—- ©}; (0) 
2H D) -OLQ + One (5.24) 


tous les pôles du deuxième terme de l'expression (24) reposant dans 
le demi-plan p gauche. 
Maintenant l'expression (20) Le s'écrire 


Age (0) = T HO ePt gp+ 1! 2 PC O0 ent Gp. (5.25) 


C— io 


Comme ©;, (0) est une Fr D, (0) -> D;, (0) (les constantes 
se confondent avec leurs transformées) et 


1 D ja (0 
Pni + D | evt dp= Ds (0). (5.26) 


C—io 
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L'expression (25) devient 


Age (1) = Dis (0) + i © PCIe OÙ ent Gp. 


e 100 


[CH. 1 


(5.27) 


Le deuxième terme du second membre de (27) peut être ramené à une 
forme analogue à celle de l’expression (18). Calculons au préalable 


les parties réelle et imaginaire de la fonction 
Os (io) — © js (0) 
A —— 


On a 


D je Gi) — D je (0) _ Re Dj (i®)— De (0) + ; Im Dya (io) 


io TA) [TA 


On en tire 


io 
Im | 200 | __ DJs (0) — Re Os (i@) 
L io D 


Re [ D ja (0) — Dj 0) 7 _ImDs Go) | 
0) 


Donc 


2xi 


c—100 


C+ico co 
4 | Os (P)— © js (0) et dp — 2 | Im = (9) (wo) cos ot do = 
P TT À 


- a ( [Te C0) Vas CU 240 sin o{ do. 


En portant cette expression dans (27), on obtient 


À js (4) _— Os (0) + = | 9 cos of do — 


A 
0 


=O; (0)—<+ [2e DO in w do + _ [ CRC sin ot do. 


(!) 


(= 


Etant donné que 


(5.28) 


(5.29) 


(5.31) 
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l'expression (30) se met sous la forme 


À js (t) = _ [= ° Vs (0) Ga) in wt do — 
0 


= Dj, (0)+ À | Æ TH 09) cos ot de. (5.32) 


0 


L'expression (32) a lieu pour t > (. 
3. Systèmes à déphasage minimal. Pour un système commandé 
monovariable la relation (18) s'écrit 


N(t=< 


O9 8 


Re ® (iw) cos ot do — —{ | Im (iw)sinwtdw (t>0). 
0 


(5.33) 
En adoptant. les notations 
Re O (io) = P (w), Im © (iw) = Q (w), (5.34) 


on peut récrire la relation (33) de la façon suivante: 


N(=< | P (o) cos wt do = —À | Q(w)sinwt dw. (5.35) 
0 0 


D'une façon analogue, pour un système monovariable la relation (32) 
devient 


À (=1 [2 sin ot do = P (0)+ — 2 (2 CG) cos wt do. (5.36) 
Ù 0 


La relation (36) rend compte du fait que 

D (0) = [D (p}lpæy — P (0). 
En déduisant les relations (18) et (32), nous avons admis que la 
fonction ® (p), qui est une fraction rationnelle de p: 


© (p}=® (5.37) 


est une fraction régulière et que le système concerné est asympto- 
tiquement stable. Ceci signifie que tous les zéros du polynôme f (p) 
ou, ce qui revient au même, tous les pôles de la fonction © (p) se 
situent dans le plan de la variable complexe p strictement à gauche 
de l’axe imaginaire. 
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Remarquons sans démonstration ([82], [41], p. 246) que pour les 
systèmes asymptotiquement stables (c’est-à-dire pour la fonction 
O (p) dont tous les pôles reposent dans le demi-plan p gauche), les 
fonctions P (o) et Q (w) se définissent mutuellement étant liées par 
des formules suivantes qui représentent la transformation de Hilbert : 


P(w=—1 202 au, | 
0 | (5.38) 
Q (o) )=+ 1 pu) = du. 


En désignant par À (w) le module de la fonction ® (iw), et par % (w) 
son argument, on a 


O (iw) = R (w)eiv(o), (5.39) 
ce qui conduit à 
In ® (iw) = In R (w) + ib (o). (5.40) 


Les fonctions In À (o) et 1 (w) sont associées à la fonction In ® (iw) 
de la même façon que P (w) et Q (w) le sont à la fonction ® (iw). 
C'est pourquoi on peut dire d’une façon analogue à (38) que si tous 
les pôles de la fonction 1n © (p) reposent strictement à gauche de l'axe 
imaginaire dans le plan de la variable complexe p, les fonctions 
In R (w) et + (w) vérifient les relations 


In R (w) — —1 | YO qu, | 


ri (5.41) 
1 In R 
po) = — | Ee, du. 
Etant donné que d’après (37) 
In®(p)=In Fe —]In/(p}—Inf(p), (5.42) 


parmi les points singuliers de la fonction 1n © (p) il y a non seule- 
ment les zéros de la fonction f (p) mais aussi ceux de la fonction / (p). 
(En vertu de (42), si L (p) — 0, on a In © (p) —— —0o.) 

Ainsi, les formules (41) qui définissent À (w) à l’aide de 1 (w) 
et inversement ne sont vérifiées que si non seulement lous les pôles 
de la fonction 
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mais encore tous ses zéros se situent strictement à gauche de l'axe imagi- 
naire dans le plan de la variable complexe p. Les systèmes qui res- 
pectent cette condition s'appellent systèmes à déphasage minimal. 

Les systèmes à déphasage minimal se distinguent par le fait que 
de tous les systèmes possibles de même réponse en amplitude R (o) 
ils ont le plus petit déphasage quelle que soit la valeur de la fréquen- 
ce w. Par déphasage on entend la valeur négative de l'argument de 
® (iw), c'est-à-dire — 1 (w). 

Ainsi, la fonction 

___ (+ pt) (+ pts) 

DE GET) GE pre) 45) 
est la fonction de transfert d’un système à déphasage minimal, alors 
que 

NE (1 — pti) (1 + pt2) , 

DPI = ET) Gr pre (5-44) 

est la fonction de transfert d'un système à déphasage non minimal. 
La fonction ®, (p) peut s’écrire 


4 — 
D: (p)}= Di (p) + (5.45) 

D'où 

®: (io) = D: (iv); = (5.46) 
Puisque 

1 —i à: 

ion = "#19, tg ® = &T:, (5.47) 
il vient 

D, (iw) = D, (io) e-°i9. (5.48) 
Introduisons les notations 

u, (©) = —arg ®, (iw). (5.49) 


Nous avons dit plus haut que la fonction u, (w) s'appelle déphasage. 
Voici le sens de cette notion. Le signal de sortie d’un système 
à fonction de transfert (D) est 


z = D(D)z(t). 


Pour z (t) = aeïvt le processus stationnaire est traduit par l’expres- 
sion 
z(t)=O(iv)aeivt = R (v)e- im (Naeivt = R (v) aeilvt-n1 (1, 


Comme il résulte de (48) 


arg ®, (io) = arg O, (iw) — 2p 
ou 


—hHe (©) = —m (©) — 29. 
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Par suite, 
He (wo) = pi (o) + 2. (5.50) 


De cette façon pour la même forme de la fonction À (o) le décalage 
de la phase u, (©) du système à déphasage minimal est plus petit 
que celui de tout système à déphasage non minimal. 

Les systèmes à déphasage non minimal avec zéros p = æ+ik sur 
l’axe imaginaire s’emploient, par exemple, pour égaler à zéro 
| D (io) lu=k, lorsqu'il faut que le système ne laisse pas passer des 
signaux de fréquence w = À. On associe également aux systèmes 
à déphasage non minimal les organes sans erreur de position (organes 
astatiques), c’est-à-dire les organes dont la fonction de transfert 
possède un pôle en origine. 

Pour certaines formes de lieux de transfert d’un système en boucle 
ouverte, lorsqu'on peut rendre impossible l’encerclement par ce 
système du point (—1, i0) par rotation du lieu de transfert dans le 
sens des aiguilles d’une montre, on branche en série dans le système 
en boucle ouverte (pour stabiliser le système en boucle fermée) 
un organe à déphasage non minimal. 

Dans la synthèse des circuits électriques, les organes à déphasage 
non minimal s’emploient comme correcteurs de phase. Les systèmes 
à déphasage non minimal trouvent également d’autres applications. 

4. Processus stationnaires dans les systèmes en boucle fermée. 
Constantes d'erreur. L’équation différentielle qui décrit les processus 
ayant lieu dans un système en boucle fermée monovariable a été 
donnée au $ 4 sous la forme suivante: 


f(D)z=1(D)z(t), (5.51) 
où D =< et les fonctions jf (D) et ! (D) sont des polynômes de Îl'o- 
pérateur de différentiation D — _ à coefficients constants 

f(D)= ao" +aD" +... +Lan-:D + an, (5.52) 


l (D) = loD” + DTA +. + Um-1D + Lim (m < n). 
La fonction de transfert d'un système en boucle fermée est 
1(2) 
DD)=- 5): (5.53) 
Comme nous l'avons indiqué au $ 1, le processus stationnaire est 
la loi du mouvement d’un système asymptotiquement stable dans 
le cas où le signal d'entrée z (t) est amené à l'instant t, = —o. 


En supposant que le système (51) soit stable, le processus stationnaire 
s'écrit en vertu des formules (1.22) et (4. 19) 


z(t)= N(t—T)z(T) ar [N(@26—2) dE, (5.54) 
00 0 
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où la fonction de poids du système {V (t) est déterminée par la rela- 
tion opérationnelle 


pO(p)>N (t). (5.55) 


Dans le cas où le signal d’entrée z (ft) est un polynôme en t de 
degré gq, la fonction z (1 — E) peut être mise sous la forme: 


q 
2(—E)= D (—1) Or. (5.56) 


r=0 


Dans ce cas l'expression (54) se ramène à la forme: 


q co 
2 (= D (10) À EN (de. (5.57) 


r= 0 


Les intégrales impropres de (57) sont les moments de la fonction de 
poids N (t): 


pr= [EN(E)SE (r=0,1,2, ...). (5.58) 
0 


Comme on le voit de l'expression (4.15) de la fonction N (t), les 
intégrales (58) sont convergentes. Compte tenu du fait que conformé- 
ment à la relation opérationnelle (55) 


[ N (E)e-vt dé = © (p), (5.59) 
0 
on trouve que 
(—1) EN (E) e-75 dE = © (p). (5.60) 
Les relations (58), (59) et (60) entraînent 


Lo = | N (E) dé — © (0), (5.61) 
0 


pr= [EN(E)&=(—1)00(0) (r=1,2,...). (5.62) 
0 
En vertu de (61) et (62), de” ypa (57) devient 


q 
2 (= D 270 20 (9. (5.63) 


r=0 
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Supposons maintenant que le système décrit par l'équation (51) 
consiste à reproduire la fonction © (D) z (t) où © (D) est un polynôme 
de l'opérateur D = d/dt à coefficients constants 


o(D)z(t}= 020 (t)+ ot 0 (+... Hosz' (t) + ooz(t). (5.64) 
Ainsi, l'erreur du système est 
e(t) =zx(t) — © (D)z (+). (5.65) 
Avec les relations (63), (64) et (65) on a 


l q 
e()= Y [Fo (0) — 6 | 20 (+ D +o” (0)z° (4). (5.66) 
r=0 r=l+1 
Les grandeurs 


Le 
= 7 1(0)—o,. (r—0,1,2, ...) (5.67) 
sont dites constantes d'erreur. Si le signal d’entrée z (t) est un poly- 


nôme en t{ de degré égal ou inférieur à k, on a pour l'erreur & (t) 
du système 


R 
e(t)= > cz (1). (5.68) 
Le coefficient 
Co = D (0) — Oo (5.69) 


s'appelle constante d'erreur statique ou erreur de position. Lorsque 
Co = 0, le système commandé est dit astatique ou sans erreur de posi- 
tion. 

Le coefficient 


©, = D” (0) — o, (5.70) 
se nomme constante d'erreur de vitesse. Le coefficient 
Ca = + D” (0) — 02, (5.71) 


est dit constante d'erreur d'accélération. Par système  astalique 
d'ordre k on entend un système dont 
Co =0, cu =0,..., Cr = 0, x #0. 

5. Processus stationnaires dans un système asservi. Examinons 
maintenant les constantes d'erreur d'un système asservi. Un système 
asservi doit reproduire le signal d’entrée z (t). Soit z ({) un certain 
polynôme en ft. L'erreur d'un système asservi est déterminée par 
l'expression 

e (t) = z(t) — 2 (+). (5.72) 


D'après (64), on a pour un système asservi 
Co = 1, = 02 =... = 0. (5.73) 
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Conformément à (67) et à (73), les constantes d'erreur d’un système 
asservi sont 


co= D (0) — 1, 
=D (0) (r—1, 2, ...). (5.74) 
Dans un système asservi astatique la constante c, doit être nulle, 
c'est-à-dire il faut que soit vérifiée la relation 
D (0) = 1. (5.75) 
On peut démontrer que pour qu'un système asservi en boucle fermée 
soit un système astatique de degré k (c'est-à-dire que ses constantes 
d'erreur Co, Ci Cas + + + Cn_1 Soient nulles, alors que c, Æ 0), il 


faut et il suffit que la fonction de transfert G (D) en boucle ouverte 
soit de la forme 


G(D)= Gi (D), Gi(0)Z0. (5.76) 


Voici la démonstration de cette proposition. En vertu de (1.66), 
la fonction de transfert en boucle fermée s'écrit 
_._G(D) = 77 
DOD)= TG 5 : (9.44) 
D'après (76) et (77) 
G (p) G (p) 
D(p)= = = ——— 
PE TRCE +6 0 
ou 
1 
"Ta w 
Pour des valeurs de p petites en module (c’est-à-dire dans le voisinage 


du point p = 0), la fonction ® (p) peut être représentée par la série 
convergente suivante : 


D(p)= 1-2 

(p}=1— Gi (P) + 

L'expression (79) implique 
D(0)—1, D’(0)--0, D’(0)=0, ..., D'*-b (0) —0, 


k! = 
14310 : (0) = —GU) 5 0. (5.80) 


D'après (80), les constantes d'erreur d’un système asservi, définies 
par les expressions (74), sont 
Co — 0, C1 — 0, ... Ch] — 0, Ch ZE 0, (5.81) 

c'est-à-dire si la condition (76) est observée, le système asservi consi- 
déré est en effet un système astatique de degré k. 

De cette façon, pour qu’un système asservi en boucle fermée 
soit un système astatique de degré k il faut que la fonction G (p) 
possède en p = 0 un pôle d'ordre 4. 


6—0393 


p°À 


M: (5.79) 


CHAPITRE 2 


SYSTÈMES COMMANDÉS NON LINÉAIRES 


$ 6. Stabilité des systèmes commandés non linéaires. 
Critères fréquentiels. 
Application de la méthode directe de Liapounov 


1. À propos d'une classe de systèmes commandés non linéaires. 
Nous allons examiner les oscillations libres d’un système non linéaire 
décrit par les équations différentielles suivantes: 


n 
d | | 
TL = D ajntr + by (= 1, 7 
Rk=1 
y=p(0), (6.1) 


n 
o=2 ChTh) | 
=! 


où la fonction œ (0) vérifie la condition 
p (0) = O. (6.2) 
Le système d'équations (1) peut s'écrire: 
n n 
d | ; ui 
= N entr +09 (S Ch ) (j= 1, sis (6.3) 
k-:1 k_.1 
Si l'on introduit les matrices 


l ss tel | T! | | bs 
==! , T = . + A = s -ïe: -*% , ° 
ir “| Th b, (6.4) 


et si l’on désigne par D l'opérateur de différentiation par rapport 
au temps 


d 
De, 


on peut remplacer le système d'équations différentielles (3) par 
l'équation vectorielle 


(ED — a) x — bg (cr) = 0, (6.5) 


où par Æ on désigne la matrice unité. 
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En plus de la condition (2k on suppose que le graphique de la 
fonction æ (0) se trouve tout entier dans le domaine angulaire déli- 


Fig. 6.1 


mité par la figure 6.1, c’est-à-dire que 


0g29 <K. (6.6) 
Avec À — oo, la condition (6) se ramène à l'inégalité 
og (0) > 0. 
Pour b = 0, l'équation vectorielle (5) se met sous la forme 
(ED — a)x = 0. (6.7) 
A l'équation différentielle (7) correspond l'équation caractéristique 
| A (p) = 0, (6.8) 
où. 
À (p) = det (Ep — a). (6.9) 


Nous allons appeler cas principal celui où toutes les racines de l’équa- 
tion caractérist'que se situent dans le plan de la variable complexe p 
à gauche de l’axe imaginaire, c’est-à-dire 


Rep; <0 (j=1,...,n). 


Dans ce qui suit nous nous bornerons à l'étude du cas principal. 
Le système d'équations (1) peut s’écrire sous la forme vectorielle 


(ED — a) x = by, y = @ (0), "C7: (6.10) 
En éliminant x de l'équation (10) on obtient l'équation suivante: 
o = c(ED — a)”! by. (6.11} 

Introduisons maintenant les notations 
W (D) = —c (ED — a) b. (6.12) 


L'équation (11) devient 


o=—W(D)y.: (6.13} 
6 
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La matrice W (D) peut se mettre sous la forme: 


: adj(ED—a) |,  M(D) 
PO det(£ED—a)  A(D) 
L'expression (14) montre que la fonction W (D) est une fraction 
rationnelle scalaire dont le degré du numérateur est inférieur à celui 
du dénominateur. 

2. Interprétation de la fonction W (D). À un système commandé 
dont les oscillations libres sont décrites par les équations (1), on peut 


(6.14) 


Fig. 6.2 


faire correspondre le diagramme fonctionnel représenté sur la figu- 
re 6.2. Ce diagramme est celui d’un système en boucle fermée dont 
la chaîne de retour comporte un élément non linéaire. Par z ({) on 
désigne le signal d'entrée. Le diagramme concerné est décrit par 
l'équation 


o—W (D)1z(t) — o (0), (6.15) 
d’où l’on tire que 
6 +W(D)œ(0o) = W(D)z(b. (6.16) 
Dans le cas particulier où 
p (0) = ho, (6.17) 
l'équation (16) devient : 
A + AW (D)1o = W(D)z (+), (6.18) 
ou 
re en LU) (6.19) 


Puisque d’après (14) 
W (D) M (D) (6.20) 
1+hW(D) A(D)FAM (D)! D 
l'équation (19) peut s'écrire 
[A (D) + RAM (D)lo = M (D) z (6). (6.21) 
Les oscillations libres d'un système en boucle fermée pour q (5) — 
— ho sont décrites par une équation homogène qui s'obtient à partir 
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de (21) avec z (t) = 0: 5 
[A (D) + hM (D)lo = 0. (6.22) 


L'équation caractéristique qui correspond à l'équation différentiel- 
le (22) est 


A (p) [+ RE = à Gp) 14 + RW (p) = 0. (6.23) 

Dans le cas principal examiné tous les zéros du polynôme A (p) 
se situent dans le demi-plan gauche de la variable complexe p. Par 
conséquent, pour que le système en boucle fermée soit asympto- 
tiquement stable lorsque œ (a). — ho, c'est-à-dire que l'équation 
caractéristique (23) n'ait pas de racines dans le demi-plan droit p, 


Fig. 6.3 Fig. 6.4 


en vertu du critère de Nyquist, il faut et il suffit que lors de la rota- 
tion autour de l’hodographe du vecteur kW (iw), le nombre de tours 
qu'on fait autour du point (—1, 0) soit nul (fig. 6.3), ou que lors 
de la rotation de l’hodographe du vecteur W (iw) le nombre de tours 


qu'on fait autour du point (— L : 0) soit nul (fig. 6.4). Etant donné 


que les fonctions (0) vérifient la condition (6), les fonctions linéai- 
res ko qui font partie de cette classe respectent la condition 0 << 
<h LL k, ou 


1 1 


—o<—-r<—-T. (6.24) 


Si l’hodographe du vecteur W (iw) est de la forme représentée 
sur la figure 3.2, il existe une valeur k=— h*, vérifiant l'inégalité (24), 
telle que le point À se situe à l’intérieur de la branche suivant 
laquelle la rotation du rayon vecteur ayant pour origine le point 
= 0) a lieu dans le même sens que la rotation suivant la branche 


h°°? 
extérieure de l’hodographe. Par conséquent, pour À — h*, le système 
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en boucle fermée est instable. Par suite pour qu'un système en boucle 
fermée soit asymptotiquement stable quelle que soit la fonction @(o) = 
= ho, où h€ (0, k]j, il faut et il suffit que l'hodographe du vecteur 


W (iw) ne coupe pas l’axe réel sur l'intervalle | —o, —+| 


(fig. 6.5). Si k — oo, on a 0 < h < ©, c'est-à-dire la zone interdite 


Fig. 6.5 


est l'intervalle (—oo, 0). L'origine des coordonnées elle-même ne 
fait pas partie de la zone interdite, car nous examinons les fonctions 
o (o) = ho pour un À aussi grand que l’on veut mais fini. 
3. Lieu de transfert modifié. Nous avons utilisé plus haut la 
relation (14) pour introduire la fonction 
__M(D) 
PO au 
Coupens la chaîne de retour du système représenté sur la figure 6.2. 
Le système en boucle ouverte de la figure 6.6 sera alors décrit par 


l'équation 
os = W(D)2z (+1), (6.25) 


où par z(t) on désigne le signal appliqué à l'entrée du système. 


Fig. 6.6 


Comme il résulte de l'équation (25), la fonction W (D) est la 
fonction de transfert du système er boucle ouverte représentée sur 
la figure 6.6. 
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Conformément à l'expression (14), le lieu de transfert d’un système 
ouvert est 

M (iw) mn eya 

UT (6.26) 


Introduisons maintenant la fonction W* (w) définie par les relations 
suivantes : 


W (iw) — 


Re W* (w) = Re W (io), | 


Im W* (w) =w Im W (iu). (6.27) 
Ainsi, la fonction W* (w) s'écrit 
W®# (wo) = Re W (iw) + iw Im W (iw). (6.28) 


Puisque Re W (iw) est une fonction paire de w, et Im W (iw) est une 
fonction impaire de w, en vertu de (27), la fonction Im W*(w) 
est une fonction paire de wetona 


W*(—ow) = W*(w). (6.29) 


La fonction W* (w) s’appelle lieu de transfert modifié. 

Puisqu’n vertu de (14) la fonction W (D) est une fraction 
rationnelle dont le degré du numérateur est inférieur à celui du déno- 
minateur, on aura pour W (p) l'expression suivante 


M (p) _ Bop"+ Bip ii... + Bm1p + Bm 
PE pomeeipoddpra Ven) (60) 


Dans le dénominateur de (30), le coefficient de p" est égal à l'unité, 
car d’après (9) 


À (p) = det (Ep — a). 
En posant p = iw, on obtient d’après (30) que 


. \ _ Mio) _ Bolio)m+ Bi (iw}m-1+ ... + Bm_1io+ B 
GO) Ge) Ga A GE Anton VC) 


(6.31) 


L'expression (31) entraîne 
limW(iw)=#%, lim W(iv)—0. (6.32) 
o—0 n qu) — 00 


En multipliant les premier et second membres de l'expression (31) 
par w, on obtient 

po 5 OM (io) 
OW (io) = —i Ga) 


_ .Bo(Gio)}ntiLB; (ion +... + Bm-1 (0) + Biw 
te (io) + As (HO) +... H'Antio+ An (m<n). (6.33) 
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En tenant compte que suivant (27) 

Re W® (w) = Re W (iw), 

Im W# (©) = &w Im W (iw) — Im [wW (iw)|, 
on trouve que 


lim Re W* (w)= 2, lim Im W®* (w) —0, 
o—-0 n 0 
et par conséquent, 
lim W° (w) = (6.34) 
w—0 ° 


La valeur de lim W* (w) diffère suivant que n — m — 1 ou 


n—m >. ? 
Pour nr — m — 1, c'est-à-dire pour z — m + 1, on a d’après (31) 
et (33) 
limReW*(w)—0, limIimW*{(w)= —B,. 
QG) — 00 &@ — 0 
Pour nr — m > 1, c'est-à-dire pour n=m+2,m+3,...,ona 
lim Re W®(w)=—0, Jim Im W*(w)—0. 
G) —= 00 QU) — Co 
Ainsi, 
pour n—m = 1, 


—_;B 
lim W* @)={ “ (6.35) 


die (Ù pour ñn—m >> 1. 


4. Théorème de V.-M. Popov. Définition. Le système (1) 


d ; 
= = > eus +by = ts sn), 


y— (0), 


dont la solution triviale T1 = La =... —=Zïn = 0 est asymptotique- 
ment stable quelles que soient les formes de la fonction @ (0) respectant 
la condition (6) 
[e) 
Er <k 


est dit absolument stable dans l'angle 10, kI. 

Comme les fonctions linéaires @ (6) = ho (0 < h < k) font partie 
des fonctions  (o) admissibles d’après la condition (6), la condition 
imposée à l’hodographe du vecteur W (io) Ne qui consiste à ne pas 


couper l'axe réel sur l'intervalle (—, SE (fig. 6.5) est une con- 
dition nécessaire de la stabilité absolue du Re (1). La condition 
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suffisante de la stabilité absolue est donnée par le théorème de 
V.M. Popov. 

Théorème de V.-M. Popov. Pour rendre le système (1) 
absolument stable dans l'angle 10, k], il suffit qu'il existe un nombre 
réel fini q tel que pour toute valeur de w > 0 la condition 

Re (1 + igu) W (iw)+ + >0 (6.36) 
soil vérifiée. 

9. Formulation géométrique du théorème de Popov. Notons 
que la condition suffisante (36) de la stabilité absolue d’un système 
non linéaire formulée dans le théorème de Popov se distingue nette- 
ment des contraintes imposées aux systèmes linéaires par le critère 
de Nyquist. Ce dernier n'’impose une limitation de la valeur de 
Re W (iw) qu'aux points où Im W (iw) = 0. En d’autres points la 
valeur de Re W (iw) peut être quelconque du fait que la limitation 
de la valeur de Re W (iw) aux points où Im W (iw) = 0 rend impos- 
sible l’encerclement du point (— . x i0 ) par l'hodographe du 
vecteur W (iw), ce qui assure précisément la stabilité asymptotique 
du système linéaire en boucle fermée. Quant à la condition suffi- 
sante (36) de la stabilité absolue d’un système non linéaire, formulée 
dans le théorème de Popov, elle impose la limitation des valeurs 
de Re (1 + igo) W (iw) pour tout w > 0, et non seulement aux 
points où Im W (iw) =: 0. 

Nous avons introduit précédemment le lieu de transfert modifié 
W®# (w). Désignons par X et YŸ respectivement les parties réelle et 
imaginaire de W* (w). D'après (27), on a 


X=ReW"*{(w)—ReW (iw), 7. 
Y=ImW*(w)=wmWw 22 40 
En vertu de (37) 
Re (1 + igow) W (iw) = 

= Re W (iw) — go Im W (iw) = X — qY. (6.38) 
Ainsi, la condition (36) devient 

X—qgY ++>0 (pour tout w=>0). (6.39) 
Dans le plan XŸY (c’est-à-dire dans le plan de la variable com- 
plexe W®*) l'équation 

X—qgY++=0, 


ou l'équation équivalente 


sh (rt 


+). (6.40) 
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détermine une droite (fig. 6.7) qui passe par le point (—1/k, 0). 
La pente de cette droite est égale à 1/q. La droite (40) peut être nom- 
mée droite de Popov. 

On voit sans peine que la condition (39) est vérifiée en tout point 
du plan de la variable complexe W*, qui repose à droite de la droite 
de Popov. Autrement dit, la condition (39) traduit le fait que l’hodo- 
graphe du vecteur W* (w) doit se situer à droite de la droite de Popoy. 

Formulation géométrique du théorème 
de Popov. Pour que le système (1) soit absolument stable dans 
l'angle [0, k], il suffit qu'on puisse choisir dans le plan de la variable 


droite de 
Popov 


Fig. 6.7 


complere W* une droite qui passe par le point (—1/k, i0) tel que 
RE du vecteur W* (w) se situe tout entier à droite de cette 
igne 

6. Sur la possibilité de démontrer le théorème en se bornant au 
cas q >> 0. Adressons-nous au système d'équations (1). Transfor- 
mons ce système en posant 


y = ko — y. (6.41) 
Couue d’après (1) y = œ (0), la relation (41) peut s’écrire: 
p (0) = ko — y (0). (6.42) 


Les fonctions œ (0) satisfont à la condition (6), c’est-à-dire les courbes 
des fonctions @(o) se situent dans l'angle [0, k] (fig. 6.1). Des rela- 


tions (42) et (6) il ressort que les fonctions p (o) également respectent 
la condition 


<<, 


c'est-à-dire que les courbes des fonctions @ (0) ne sortent pas non 
plus de l’angle [0, kJ. Ainsi, si le système initial (1) est absolument 
stable dans l'angle [0, kÆ}, le système transformé à l’aide de la rela- 
tion (41) est également absolument stable dans cet angle. 
D'après (13) 
—06 = W (D) y. 
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En remplaçant y par sa valeur-tirée de (41), on obtient 


| —0o = W (D) (ko — y). (6.43) 
Il en résulte que 
—o0=W (D)y, (6.44) 
où 
— W (D 
W (D)= — ND (6.45) 
La relation (45) entraîne 
A (in — — Woo) . 


On vérifie aisément l'identité suivante : 


Re (4 + igo) W Go) ++ 


À SE 1 
Re (1 — igo) W (iv) ++ — TE EW Go) E (6.47) 
En effet, 
; W 1 
Re (1 — iqu) Perle Er + à] = 
—W+iqoW+T+W 4 | 1 
Re es W+— - 9 


1 , do 
= TEAWTE Re| igoW + gx + W + iqok| WF] — 
ce qu'il fallait démontrer. 
Etant donné que tous les pôles de la fonction W (p) = FU ) 


reposent à gauche de l'axe imaginaire, la valeur de W (iw) est finie 
quelle que soit la valeur de «. Par suite si le système considéré 
satisfait à la relation 


|1+ kW [* 


Re (1 + igu) W (iv)++>0, (6.48) 
en vertu de (47) on a également la relation suivante 
Re (1+ igo) W (io) ++>0, (6.49) 
où 
q = —q<0. (6.50) 


Nous avons dit plus haut que si le système initial est absolument 
stable dans l'angle [0, k], le système transformé le sera également. 
Mais pour le système transformé, la condition du théorème de Popov 


est exprimée par l'inégalité (49) où qg = —q < 0. 


92 SYSTÈMES COMMANDÉS NON LINÉAIRES (CH. 2 


D'après ce qui vient d’être dit pour démontrer le théorème de 
Popov, on peut se borner à l’examen du cas g > 0. L'étude du cas 
q = —q < 0 ne peut pas étendre la classe des systèmes soumis à la 
condition suffisante de Popov, du fait qu'avec q = —gq on obtient 
le même système (à stabilité déjà établie par la relation (36), où 
q > 0), mais ramené seulement à une nouvelle variable y. 

. Lemme 1. Soient 
df. 
dt , 

2) G (x) > 0 une fonction continue pour tout x # 0 et telle que 

G (0) = 0; 


1) f (t) une fonction continue bornée pour { > 0 avec sa dérivée — 


3) | G[f(t)1dt € . 
0 


Montrer que dans ces conditions 
to 


Démonstration. nas vd 
jUI<a<oæo, |[<b< oo, (6.51) 


(enma=c< co. (6.52) 
0 


Supposons que l'affirmation du lemme soit fausse. La définition de la 
limite entraîne alors qu'il existe une suite croissante illimitée de 
nombres /, > 0 telle que 


[fm I1Zze>0 (k = 1,2,...). (6.53) 
De plus, on peut toujours considérer que pour tout Æ 
lt — h Zzm>O, (6.54) 


car si cette condition n’est pas observée pour la suite initiale, en 
omettant une partie de termes de la suite on peut parvenir à faire 
respecter cette inégalité. 


Puisque l< b, on a pour tout t > 0 
If —f()I<dott- tu l. (6.55) 
Compte tenu du fait que G (x) > 0 pour tout rÆ0,ona 
+ 


[eroa>s | GIf(t)l dt. (6.56) 


=] m 
RTS 
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Mais toutes les valeurs de ! telles que 
ta LIL +T- 
donnent lieu à l'inégalité 
1OI=T (4) +1f (6) —f (12 
>1f(4)|—1f 0) —f(4)1>E—b5 =. (6.57) 


Si l’on choisit m suffisamment petit, e, sera positif 


eo > 0. (6.58) 
Si l’on désigne 
r—= min Gix), (6.59) 
eo=<ixl <a 


où, en vertu du lemme, r >0, on a l'estimation 


m 
J'ARES 


| G[fW}d>rm. (6.60) 


m 


RUT 


On en déduit, en vertu de l'inégalité (56), 


| GIf(t)]dt = oo, (6.61) 


0 


ce qui ramène à l’absurde la condition du lemme. Cette contradiction 
prouve le lemme. 

8. Lemme 2. Si avec {+ oo les trois fonctions réelles f, (4). f2(t), 
f: (#) tendent vers zéro aussi ou plus vite que les exponentielles (ce 
que nous noterons /fy ({) =? 0) et si leurs transformées de Fourier 


F, (iv) = [ fnte-ist dt  (k—1, 2, 3) (6.62) 
0 
sont liées par la relation 
| F, (io) = H (io) F, (iw) + F, (iw), (6.63) 
où 
Re H (iw)>6>0 (6.64) 


pour tout w, alors 


= | hÜfO4<C  (C>0), (6.65) 
0 
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où la valeur de la constante positive C est finie et où cette constante 
se détermine par l'égalité 


+00 
1 es 
Ces | | Fe (io) do. (6.66) 


Démonstration. Puisque f, (t) = 0, f4 (t) = 0, on peut 
appliquer la formule de Parseval [17, 90] 


| fi (0) fs (0 dt = + | FiGio) F, (iv) do. (6.67) 
0 0 
En remplaçant F, (iw) par sa valeur tirée de (63), on obtient 
fhOAOd=S | Go Fr, Gu)+FGu)]F; (iv) de. (6.68) 
0 — 00 


Le premier membre de la relation (68) étant réel, la partie imagi- 
naire de l'intégrale du second membre de (68) est nulle. Il vient 
donc 


fhoftwa=S | RelGo)|F, (io) P+F, (a) Fs (iu)] do = 
0 — 00 


CO 


= | {Re H (iw) | F; (iu) P + (F2 (io) Fs (io) + 


+ Fa (iw) F3 Gu)] } du = 


7 Re A Go) EF, (ie) + — #20) 
= 7 | [VRe H (io) F3 (iw) +: V7 =. * 


ES 7 
s [V'Re H (iw) F; G+ | 


| C Fa (io) |? 1 C ET PF ERTS , 
x | nr Le: | IV Re A Qu) Fs (iw) +- 


œo 


0). 4 = | KT GO) Go. (6.69) 


—— ( — 
2 VRe 11 (io) 8x Re Æ (iw) 


En rejetant le premier terme du second membre de la relation (69) 
qui est toujours positif et en tenant compte du fait que d’après (64) 


Re À (iw) 8 > 0, 
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on obtient que , 
(# (£) fs (2) d>—— ( | Fa (io) [2 du, (6.70) 
c'est-à-dire | . 
— [a (£) fa (#) HE Î 1F Gu) F do. (6.71) 


Comme d’après la condition du lemme, pour { — œ la fonction 
f2 (t) tend vers zéro aussi ou plus vite que l’exponentielle, c’est-à-dire 


comme | fi (t) dt converge, et suivant la formule de Parseval, 
0 


© ©œ 


f£Oa=S | | Fe (iw) F do, 


0 — 00 


l'expression (71) se met sous la forme 
= | fa (6) fa (4) dt &C< 00, (6.72) 
0 


ce qu'il fallait démontrer. 

9. Démonstration du théorème de Popov. En plus des articles de Po- 
pov [73], la méthode qu'il a développée et sa mise au point ultérieu- 
re ont donné lieu à une littérature abondante [3, 22, 54]. Parmi les 
nombreuses démonstrations de son théorème nous avons retenu celle 
donnée par la monographie {3]. 

Comme nous l'avons montré au point 6, il suffit de prouver 
le théorème sous l’hypothèse que dans la formule (36) q > 0. Soit 
z;(t) Ü = 1, ..., nr) une solution du système d'équations diffé- 
rentielles (1) 


ñn 
dx . 
= D aura + buy G=1,...,n), 


R=1 
y= (6), 
n 
O = > Cklh 
R=1 


avec la fonction y(0o) choisie arbitrairement mais fixée dans l’angle 
[0, k] et certainesconditionsinitiales également arbitraires maisfixées. 
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Si l’on porte les fonctions x} ({), qui représentent la solution indi- 
quée plus haut, dans les formules 


= NO cxx et y=p(0). 
k 


on obtient que pour le système (1) avec la fonction œ (o) fixée et les 
conditions initiales choisies, 


o—0 ({)= pa CaTu ({). (6.73) 
y=y(t)= 10 (t)], (6.74) 


c'est-à-dire il se trouve que la fonction y ({) est une fonction du temps 
connue. 


Les fonctions x; (4) (j =: 1, ..., n) indiquées plus haut peuvent 
donc être considérées comme solution du système d'équations linéaires 
inhomogènes 


n 
d ; à 
DS ajn£a + bjy (1) AS sis): (6.75) 
k-1 
où la fonction y (t) est déterminée par l'expression (74), alors que les 
conditions initiales sont les mêmes que celles données pour la résolu- 
Lion du système d'équations (1). 
wæ Adoptons maintenant la notation yr (t) pour la fonction suivante 
y(t) pour i{<T, 
ÿr o={ | . (6.76) 
pour {>T, 


où T est un nombre positif fixe arbitraire, et soit la fonction 


Or(!{)= an Catir (1) (6.77) 


déterminée par un do d'équations linéaires inhomogènes 


dx , Le À 
= =S ajntar + byyr () (=, ...,n) (9218) 

k=! 

sous les mêmes conditions initiales suivant lesquelles a été détermi- 

née d’après (73) la fonction © (t), c'est-à-dire 


zjr (0) = x; (0) G=1,...,n). (6.79) 
11 en résulteZque 
Or) =0o{(t) pour 0O<!I<T. (6.80) 
La solution de l'équation différentielle vectorielle inhomogène 
dir 


TE = arr+ byr (0), (6.81) 
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équivalente au système d'équations scalaires (78), peut s'écrire 
t 

zr(t)=0(1)0"1(0)z(0) +08 (4) | 0-2(x)byr(t)dt, (6.82) 
0 


où 6 ({) est la matrice fondamentale des solutions de l'équation 
vectorielle homogène 


TE = atr. (6.83) 
Les éléments 6,4, ({) de la matrice 0 (t) sont de la forme: 
6,2 (£)= Pyn (6) e#t, (6.84) 


où P;, (t) sont des polynômes en t, et p4, les zéros du déterminant 
caractéristique (9) 


À (p) = det (Ep — a). 
Dans le cas principal qui nous intéresse, tous les zéros du détermi- 


nant caractéristique À (p) possèdent une partie réelle négative 
Re pr < 0 et, par suite, 


lim 6 (=0 G,#=1,..., n). (6.85) 
Il résulte de (82), (77) et (4) que 
Or(t)=0r(t)+p(t), (6.86) 
où 
t 
Or (t) = cô (#) | 0-1 (x) byr (x) dx, (6.87) 
0 
p (#) = c0 (#) 8-2 (0) z (0). (6.88) 


De la sorte, o-(t) est déterminée à partir de la solution (82) du sys- 
tème d'équations (78) sous les conditions initiales nulles, alors que 
p (t) est la fonction du temps linéairement dépendante des valeurs 
initiales z; (0) (j = 1, ..., n). Il s'ensuit de (85) que dans le cas 
principal étudié ici 


pt+0, 20 +0. (6.89) 
En dérivant (86), on a 

Or (t) = Gr (t) + p (t). (6.90) 
(86) et (90) permettent d'obtenir l'expression suivante: 


67 (t)+ gr (D — #70 25, (9 + g07 (0 — LE + o (+9 (D. (6.91) 


7—-0393 
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Introduisons maintenant les notations 
fi (e)= — 07 (#)— 007 (9 +10, (6.92) 


fa (t)= —p (€) — gp (+). 
Désignons respectivement les transformées de Fourier des fonc- 


tions fi (t), fe (2), Ur (£), Or (£) par F (io), Fe (io), Yr (io), Êr (iw). 
Ces transformations de Fourier existent du fait que yr (1) = 0 pour 


t> T, c'est-à-dire yr (t) x 0. La fonction Or (£) est déterminée 
par l’expression (87), dans Taquelle la fonction sous le signe somme 


s'annule avec { > T'; conformément à (85), on en tire que or (t) + 
—æ 0, ôr (t) Z 0. En outre d'après (88) et (85), p (0, 


p (4) +0. Ainsi, fi (9) + 0, fe (t) + 0. 
D'après (13) 
—0 (1) = W(D)y(t). 


(14) et (78) impliquent 
—0Or (t) = W (D) yr (1). (6.93) 


Dans les conditions initiales nulles, à l'équation (93) correspond la 
transformée de Fourier suivante: 


— Sr (io) =W (iv) Yr (io). (6.94) 


Ici à gauche figure —Ÿ}, (io), carils agit de la résolution sous les 


conditions initiales nulles, c'est-à-dire or (t). Dans les nouvelles 
notations (92), la relation (91) devient 


fi (= — 57 (6) — 007 (9 + HO +, (0. (6.95) 


En passant aux transformées de Fourier et en tenant compte de (94), 
on obtient 


Fi (iv) = [ (A + iqo) W (iv) ++] Yrliw)+Æ (iv). (6.96) 


Ici on a tenu compte du fait que la transformée de Fourier de Or (4) 
est iwZr(iw). Désignons maintenant 


H (io) = (1 + igo) W (iw) + _ ! (6.97) 
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La relation (96) devient alors . 
F, (io) = H (io) Yr (io) + F, (io). (6.98) 
Dans notre cas principal la condition (36) du théorème de Popov peut 
être remplacée par l'inégalité 
Re H (io) > 6, (6.99) 
où Ô est un nombre positif. Comme il a été montré au point 3, dans 
le cas principal l’hodographe du vecteur W* (w) repose toujours 
dans une partie bornée du plan de la variable complexe W* pour 
tout w. La distance minimale entre les points de la droite de Popov 
(40) et l’hodographe du vecteur W* (w) est un nombre positif, c’est-à- 


dire les coordonnées X et Ÿ d’un point quelconque de l’hodographe 
du vecteur W* (w) vérifient la condition 


X—g9Y++>65>0, (6.100) 


d’où l’on déduit précisément la condition (99). 
De plus, comme nous l'avons établi précédemment, 
fi() 0, fa() 0,  yr(t) +0. 
Donc, d’après le lemme 2,ona 


— | H( vr (OC, (6.101) 
0 
avec 
C= | | Fe (iv) E do. (6.102) 


— 00 


Comme le montrent (88) et (92), la fonction F, (iw), de même que 
son original f, (4), dépend de façon linéaire et homogène des données 
initiales et ne dépend pas de la valeur de T. Par suite, la constante 
positive C dépend de façon quadratique et homogène des données ini- 
tiales et tend vers zéro lorsque ces données initiales tendent vers zéro. 
La constante C ne dépend pas de la grandeur T. 

En portant l'expression (92) de f, (t) dans (101), on obtient 


{un (£) [or (t) + gr (t)— tr 0 | — 
0 


pLo (#)] {a (4) +90 (—OL\ acc. (6.103) 


Our +] 


7e 
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En divisant le premier membre de (103) en deux intégrales, on a 


FT o(T) 
| plo(i{o(t-2FOl | a+ | p(o)doæC. (6.104) 
0 o(0) 


Ajoutons aux deux membres de l'inégalité (104) la grandeur positive 
o(0) 


q | o (0) do et introduisons une nouvelle constante 
0 


c(0) 
C*=C+q | p (0) do (6.105) 
Ü 


pour aboutir à l'inégalité 
T > O(T) 
focfo-2@luta | piodo<C*. (6.106) 
0 0 


Ici la constante C*, de même que C, ne dépend que des données 
initiales et tend vers zéro avec ces dernières. 

Chaque intégrale du premier membre de (106) est non négative. 
C'est pourquoi on a les inégalités 


p(o)[o— 2] ace, (6.107) 
0 | 


o(T) 
| p(c) dog C*. (6.108) 
0 


Si @ (0) est comprise dans l'angle [0, k], l'inégalité (108) n’entrai- 
ne pas encore que la fonction © (£) est bornée, puisqu'on peut choisir 


dans cet angle des caractéristiques de œ (co) telles que IE (o) do 


Ù 
sera finie (par exemple, les fonctions (0) respectant la condition 


p (0) + 0). 
C'est pourquoi admettons d’abord que q (0) satisfait à une condi- 
tion plus serrée 


Dex PO <E, (6.109) 
que la condition principale (6) 


0 70 <k, 


c'est-à-dire que (6) se situe dans l'angle [e, X) et non pas dans 
l'angle [0, k]. Alors l'inégalité (108) entraîne immédiatement que 
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la fonction oc ({t) est bornée pour t > 0, ou 

[o(HI<Z (20), (6.110) 
avec la grandeur Z qui tend vers zéro avec les écarts initiaux, puis- 
que C* jouit de cette propriété. 


Ainsi, par exemple, en remplaçant (0) par ec dans le premier 
membre de (108), on obtient 


Fes (T)<T. (6.111) 
D'où en remplaçant la grandeur arbitraire T par {, on amène l’inéga- 
lité (110) telle que 
Le (6.112) 
eq 


Mais alors, en raison des propriétés connues des équations différen- 
tielles linéaires, dans le cas principal considéré les solutions zx, (t) 
du système (75) sont également bornées 


IHOIS<N, 120(Gi=1,...,n), (6.113) 


où les constantes V;, de même que la constante Z, tendent vers zéro 
avec les écarts initiaux, du fait que les seconds membres de l’équa- 
tion (75), b;y (4) = b;e [o (t)] sont bornés si © est bornée. 

Ceci résulte de la propriété connue des solutions des systèmes 
d'équations linéaires inhomogènes relative au cas stable : si les seconds 
membres sont bornés dans l'intervalle 0 < t < oc ou s'ils tendent 
vers Zéro quand { —> co, toute solution jouit également de cette 
propriété, c’est-à-dire est respectivement bornée ou tend vers zéro 
quand it —> oc. Si, de plus, les constantes qui délimitent les seconds 
membres, dépendent des écarts initiaux (comme c'est le fait dans 
notre cas) et tendent vers zéro avec ces écarts, toute solution jouit 
également de cette propriété. 

De (113) il suit que la solution triviale du système (1) x; — 0 
est stable au sens de Liapounov. Pourtant, (113) n’entraîne pas enco- 
re la stabilité asymptotique de la solution triviale. 

Adressons-nous maintenant à l'inégalité (107). Nous avons ici 
sous le signe somme la fonction 


G({o)= p(0) [o—2®] (6.114) 
positive en vertu de l'inégalité (109) quelle que soit o 0 et G (0) — 
= 0. D'autre part, le fait que les fonctions zx; (t) sont bornées entraîne 
que d’après les équations (1) les dérivées x; le sont également, de 


même que © ({) et © (4). Remarquons que puisque d’après (102) et 
(105) la constante C* ne dépend pas de T'. l'inégalité (107) a lieu 
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pour 7" > 0 arbitraire. Il en résulte que 

[ p(o)[o— 202] a < co. 

0 


Ainsi, toutes les conditions du lemme 1 sont remplies. Conformément 
à ce lemme, on conclut que sous des conditions initiales arbitraires 


limo(t)=0. (6.115) 
{00 
Il résulte de (115) que 
lim p{o(t)]= 0. (6.116) 
t— 00 


La relation (116) peut s’écrire: lim y (t) — 0. En outre, d’après 
{1 —+ 00 


la remarque sur les propriétés des solutions des équations différen- 
tielles (p. 101), il suit des équations (75) que 


lim zi(t)—=0 H=l;:s:s,n). (6.117) 


Ce qui vient d’être dit aurait mis fin à la démonstration du théo- 
rème de Popov si nous n’avions pas remplacé'l’'angle [0, 4] par l'angle 
[e, k). Cette restriction peut être levée. Toutefois, compte tenu du 
fait que la condition (109) permet de choisir & aussi petit que l’on 
veut, nous n'’allons pas nous y attarder. 

10. Application de la méthode directe de Liapounov. Méthode 
de A. Lourié dans la théorie de la stabilité absolue des systèmes non 
linéaires. Le problème des conditions suffisantes de la stabilité 
absolue des systèmes décrits par les équations de la forme (1) a été 
pour la première fois posé et étudié par A. Lourié [59] à l’aide de la 
méthode de Liapounov. A cet effet, Lourié a proposé d'utiliser la 
fonction de Liapounov du type 


[04 


V=L(:)+8 | p(E) dE. (6.118) 


Ici 
L (x) = z*Hz, (6.119) 


où z* est la matrice ligne obtenue par transposition du vecteur x, 
et A, la matrice carrée z X nr aux éléments constants. La fonction 
L (x) est une forme quadratique des variables zx; (j = 4, ..., n). 
S'il est possible de choisir la matrice H de façon que L (x) soit une 
forme quadratique positive, alors que la dérivée dV/dt de la fonction 
de Liapounov (118), existant grâce aux équations ({), soit une fonc- 
tion négative de signe défini, le système considéré est asymptotique- 
ment stable. 
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La relation entre les méthodes de Lourié et de Popov a fait l'objet 
d'étude de Popov [73], V. Iakoubovitch [95], M. Aïzerman et 
F. Gantmacher [3]. 

Pour le cas principal examiné ci-dessus le résultat définitif a été 
obtenu par Iakoubovitch [95] qui avait démontré le théorème suivant 
lequel la condition de Popov (36) est dans le cas principal une condition 
nécessaire et suffisante d'existence des fonctions de Liapournov du 
type (118). 

Ce théorème implique que si la stabilité absolue du système (1) 
peut être établie à l’aide de la fonction de Liapounov (118), il existe 
un nombre positif réel q tel que la condition (36) du théorème de 
Popov est observée. Ainsi, le théorème de Popov couvre tout l’en- 
semble des systèmes du type (1) dont la stabilité absolue peut être 
établie à l’aide de la fonction de Liapounov du type (118). 


$ 7. Action des forces extérieures sur les systèmes non linéaires 


1. Réduction du problème aux équations intégrales. Considérons 
lelsystème décrit par les équations différentielles non linéaires sui- 
vantes 

Di oil ts ss ss ns) (0 ss D): (7.1) 
En introduisant les matrices 


Zi "pi (x; y Tn; t) 
T = … ; P(Zt se.) Tn) Lt) = _.... , (7.2) 
_Tn Pa (Zi, ss Ln): {) 


on peut remplacer le système d'équations différentielles scalaires (1) 
par l'équation différentielle vectorielle 


ZT = Pr, .-., Tn, t). (7.3) 
Supposons que les fonctions œ;(z,, ..., zh, t) puissent être 
mises sous la forme 
PJ (z:, +) Ln: t) EE [u (£) Ti + Uje (4) La SE .….. 
DE à Ujn (t) zh] TT Uy (£) + Ÿ; (Z1 ee. … Ln) t) 
G=1,...,n), (7.4) 


c'est-à-dire sous la forme de la somme d’une certaine fonction appro- 
ximante 


n 
— D un (t)zx + y; (6), 
k=1 
linéaire par rapport à z;, ..., æ, et d’une correction non linéaire 
D; (Zi, +: ., Zn, t). L'approximation linéaire peut être réalisée 
de différentes façons ; on peut, par exemple, l’assujettir à la condition 
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de petitesse de |; (2,, . .., zh, t) | dans le domaine de variation 
considéré de z,, ..., zh, etc. Le choix convenable de l’approxima- 
tion linéaire rend bien plus rapide la convergence des approxima- 
tions successives (35) de la solution du système d’équations (1). 

Conformément à (4), le système d'équations différentielles (4) 
se met sous la forme 


zj+ D UjR (t) Th = Yj (£) +; (z1, es Tno t), (J = 1, ..) n). (7.5) 


Le système d'équations différentielles scalaires (5) est équivalent 
à l'équation différentielle vectorielle 


z+u(sz = y + (au... Zn À), (7.6) 
où par u (t), y (t) et 4 (x, . .., Zn, t) on désigne les matrices 
IT (£) -.. Uin(t) Tyi (4) 
u ({) = . © .. ” . y(t) ee 0 : 
_Uni ee Unn _Un 
Ÿi (z1, ..) Ln t) (7.7) 
Ÿ(zi, RE à  .... > 
n (%1, +++, En, t) 
Introduisons maintenant la notation 6 ({) pour la matrice 
TOus (#) + -- Oun (4) 
6 (£) SE : (7.8) 
_On1(£) :-- Onn (4) 


dont les colonnes sont des solutions particulières linéairement indé- 
pendantes de l’équation vectorielle homogène 


z+u(t)z=0. (7.9) 


La matrice 6 (t) est donc la matrice fondamentale des solutions de 
l'équation différentielle (9). Chaque colonne de 8 (ét) présentant une 
solution particulière de (9), la matrice 0 (t) vérifie l'équation 


(4H +u(t)6(t) = 0. (7.10) 
Cherchons la solution de l'équation différentielle vectorielle (6) 
sous la forme 
z = 0 (1) x (4), (7.11) 
où 
x (6) 
X()=| "71. (7.12) 
An (€) _ 
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Le vecteur à définir est x (t). En portant l'expression (11) dans l’é- 
quation (6) on obtient 


(2) x (4) + 6 (4) x (8) + w (8) 8 (1) x (9) = 
= y (t) + pts - - ., Zn, À). (7.13) 


En vertu de (10), le premier et le troisième terme du premier membre 
de l'équation (13) se réduisent et l’équation (13) devient: 


BH x = y(t) HD, ..., En À), (7.14) 
on en tire 


4 (0 = 0-1 (+) y (8) + 0-1 (#) D (rs, «ns t), (7.15) 


où par 6-1 (£f) on désigne la matrice inverse. Il ressort de l'équation 
(19) que 


? t 
4(t)= | e(r)y(r)dr+ | 0"1(t)hwb{z1(t), -.., Zn (t), tldt +0, 
. ° (7.16) 


avec C, le vecteur des constantes arbitraires 


_e 
L | (7.17) 
Cn 


En portant dans (11) l'expression (16) du vecteur % (t), il vient 


C= 


t 
2(D=0(9 C+0 (1) | O-1(t)y(t)dt+ 
t 


+0(:) | O1 (t)b{ri(t), -.., zn(t), Tldr. (7.18) 


lo 
Déterminons le vecteur C à partir des conditions initiales 

[x OIErA = TZ (Lo): (7.19) 
La relation (18) amène 

T (to) = 0 (to) C, (7.20) 


et donc 
C = 0"! (4) x (to). (7.21) 
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Finalement la relation (18) se met sous la forme 
‘1 
z(t)}=0(t)0"1 (#0) & (40) + | O (0-2 (x) y (r) dr + 
to 
{ 
+ O(É)GL(t)lzilt), ..., nt), tJdr. (7.22) 
to 


La relation (22) dont la fonction sous le signe somme du second 
membre contient les éléments du vecteur zx (t) est une équation 
intégrale vectorielle non linéaire par rapport à l’inconnue zx (t). 
Cette équation intégrale est équivalente à l'équation différentielle 
vectorielle (3) considérée avec ses conditions initiales (19). 

Introduisons maintenant les notations 


N (t, 7) =060 (1) 8-1 (x). (7.23) 
La fonction À ({, t) est une matrice carrée 
Nu (é, Th, ce. Nin(t, T) 
N (é, T) =. : 
Na: (é, T), ... Nan (é, T)_ 


dont les éléments sont 


n 
Nine, T)= à, Oju (2) [877 (T)Jux- 
Notons que la fonction N ({f, t) vérifie la relation suivante: 


N (to =N(t, +) N (x, 0), (7.24) 
qui a lieu quels que soient f?, + et oc. En effet, d'après (23) 
N(t, tT)N(x, oo =06(1) 0-1 (x) 6 (t) 8-! (o) = 8 (t) 8-1 (o), 


ce qui coïncide avec la relation (24). 
La matrice inverse de la matrice W (4, +) est 


EN 6, TP = NN (x, 0). (7.25) 
La relation (25) résulte du fait que 
N(t, TDN(x;, t)) =0(60 1(1)80(x)0- ( =E, 


où par Æ on désigne la matrice unité. 
La relation (23) implique également 


N(t Ü=E 
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pour toute valeur de t. 
L’équation intégrale vectorielle non linéaire (22) peut égale- 
ment s'écrire: 


— 
z(=N(E, to) z (to) + | N(t,T)y(r)dr+ 
to 
t 
+ N'(t, T)h{zi(T), -.., nt), tldt. (7.26) 
LA 


L'équation (26) est équivalente au système suivant d’équations 
intégrales scalaires non linéaires 


ñn n 
2(9= D None, do) 2 (0) + D À Nine, D'un (D dr + 
Rk=1 


k=1 Lo 


n 1! 
+ > | Nine, TP ri(t), -.., Zn (T), tldt 


Rk=1t0 
(j=1,...,n). (7.27) 


2. Construction des solutions approchées. Dans le cas général, le 
système initial des équations différentielles non linéaires (1) n’est 
pas intégrable. Dans ce sens, la réduction du problème au système 
d'équations intégrales non linéaires (27) ne change rien au fond, 
du fait que dans le cas général les équations (27) ne peuvent non plus 
être résolues avec précision. Toutefois, pour construire les solu- 
tions approchées du système (1), il est plus commode de partir 
du système d'équations intégrales (27). Pour abréger l'écriture, 
introduisons les notations suivantes 


{ 
B()==N (Es to) 2 (60) + | NE, D y(r) dr, (7.28) 
to 


Kit, tar), ...,, m(DI=N(, Dhlz (rt), ..., z (x), T1 
(7.29) 


La matrice fondamentale 6 ({) de l'équation différentielle linéaire 
(9) étant supposée connue, on connaît également la fonction W (£, t) 
déterminée par la formule (23). On peut donc considérer comme 
connue la fonction g (t). 
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Les fonctions gt) et Alt, +, x, (x), ..., x, (t)]l sont des 
vecteurs. Les éléments de ces vecteurs sont 


ñn n t!? 
gi(t)= > N y (E, Lo) Ta (to) + Ÿ | An (, T) Ya (T) dt (j=1, sn); 


k=1 k=1 to 
(7.30) 
K;(t, t, r1(T), ..., Tn(T)) = > Nin(E, T)Pa(z1(T), -.., Tn (T), 7) 
(J w sn). (7.31) 


L'équation intégrale vectorielle (26) peut maintenant s'écrire 
t 
z(t)=g(t)+ | K{t, tait), ..., 2n (Did. (7.32) 
lo 


Le système d'équations intégrales scalaires qui correspond à l’équa- 
tion vectorielle (32) est 
t 
zi(t)=£,(t) + | Kft,T,zxi(t), ..., zn(t)]dt (j=1,...,n). (7.33) 
to 
Pour résoudre le système d’équations intégrales non linéaires 
(33) sous les hypothèses suffisamment larges relatives à la forme 
des fonctions non linéaires 1;(7,, ..., x, t), on peut appliquer 
la méthode des approximations successives. Adoptons comme appro- 
ximation nulle du système d'équations (33) 


a (t)=g(t) (j=1,...,n). (7.34) 
Les approximations successives sont 


{ 
HD (+ À Kite +, af (0), ..., 20 (r)ldr, 
to 


t 
a ()= g;(t) + | Ke, %,2%° (4), ..., x (x)]dx, 
to 


t 
a) = g;(t)+ | Ré, ta D (x), ..., 280 (x)] dx, 
to 


La méthode des approximations successives présente cet incon- 
vénient que les quadratures des expressions (35) se compliquent 
rapidement à mesure que l’ordre des approximations augmente. 
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Une autre méthode de résolution approchée du système d'équa- 
tions intégrales (33) consiste à diviser l'intervalle (£,, £) de la façon 
suivante 


to — li — Lo; 
At; = Lo — li, 
a (7.36) 


Adoptons par approximation que dans chacun de ces intervalles 
les fonctions z;(t) gardent invariables celles des valeurs qu'elles 
possédaient à l’extrémité gauche de l'intervalle. On obtient alors 
à partir des équations (33) 


zj (to) = £j (to); 
Tj(t)= Lt) + Kj lis do, Zi (lo); + + +; Tn (to)] Ato, 
T'; (le) = £} (£2) r K ; [Lo , Lo» Ti (lo); cs Tn (Lo)] Ato + 


+ K'jfle, di, L4(l), +. ., Zn (41)] At, 
ee ee + + + ‘ (7.37) 


Lj (ts) = 8j (ts) + à K j{£ss lus Ta (fn), +. Zn (tx) Ars 


(= T Re à À J 
La méthode décrite permet de construire la solution approchée 
du système d'équations intégrales non linéaires (33), c’est-à-dire 
de trouver une loi approchée du mouvement du système (1) dans 
l'intervalle ({,, t) qui nous intéresse. 


$ 8. Méthodes qualitatives d'étude du mouvement 
des systèmes non linéaires 


1. Systèmes non linéaires à un degré de liberté. Les méthodes 
qualitatives d'étude du mouvement des systèmes non linéaires 
s'appuient sur les résultats fournis par la théorie qualitative des 
équations différentielles [68] qui remonte aux travaux de A. Poin- 
caré [75]. Ces méthodes ont été largement appliquées à la théorie 
des oscillations non linéaires entre autres par L. Mandelstam, 
A. Andronov, N. Krylov, N. Bogolioubov, B. Boulgakov, I. Mitro- 
polski (4, 17, 47, 64]. Les méthodes qualitatives sont efficaces 
surtout dans l’étude du mouvement des systèmes non linéaires à un 
degré de liberté; plusieurs de ces méthodes peuvent être appliquées 
avec succès à l'étude des systèmes non linéaires à plusieurs degrés 
de liberté. Dans ce qui suit nous nous bornons à l’examen des sys- 
tèmes à un degré de liberté. 
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L'énergie cinétique d’un système à un degré de liberté, dont 
les liaisons de même que la définition de la coordonnée généralisée 
g ne dépendent pas d’une façon explicite du temps, peut être mise 
sous la forme 


= Fm (9. (8.1) 


La fonction m (q) s'appelle masse réduite du système. L'énergie 
potentielle du système est V = V (q). Pour le système considéré, 
la fonction de Lagrange s'écrit 


L=T— V. (8.2) 
L'équation du mouvement du système est dela forme: 
d fôêL 0L : 
PTS (=) — 5 = Q"(g, 9, t) (8.3) 
0q 
ou 
d [OT OT 14 : 
2 (E)- (Dore 30 


avec Q* (q, q, t) la force supplémentaire non conservative appliquée 
au système. 

Dans certains problèmes il est plus commode d'utiliser des 
variables canoniques. Pour un système à un degré de liberté ces 
variables sont la coordonnée généralisée qg et l’impulsion canonique 
(ou généralisée) p déterminée par la formule 


ô0L 
= —— (8.4) 
gq 
Pour les systèmes aux liaisons indépendantes du temps, la fonc- 
tion de Hamilton s'écrit 


H=T+V. (8.5) 
Puisque d’après (1) et (2) 

p=mt(g)g (8.6) 
la fonction H peut s'écrire 

CR 


Les équations canoniques du mouvement du système à un degré 


de liberté sont 
dq _0H 
= 7! | 


d 0H 
= — 5 + Q(; Pt), 


où Q (q, p, t) est une force supplémentaire non conservative rame- 
née aux variables canoniques. 


(8.8) 
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D'après (7) les équations de mouvement canoniques (8) deviennent 


dqg ___P_ 
dt  m(q)* 


dp m° _m” (q) ’ | 
LL — 2m 21m (q)l? p— V (9) +Q (ag, P; L). 


Lorsque la force supplémentaire non conservative Q ne dépend 
‘pas explicitement du temps, le mouvement d’un système aux liai- 
sons indépendantes du temps porte le nom d’oscillations libres du 
système. Dans ce cas les équations canoniques (9) s’écrivent 


(8.9) 


dq __p. 
dt  m(q)° 


Le m° _m" (q) , | 
= pv (+0 (ap) 


Les valeurs instantanées de g et p déterminent la position et la 
vitesse du système à un degré de liberté ou son état (phase). get p 
peuvent être interprétées comme des coordonnées cartésiennes d’un 
point (point représentatif) dans le plan gp. Ce dernier s'appelle 
plan de phase; q et p sont les He . À ut du point repré- 


sentatif dans le plan de phase. De plus © et: a sont les composantes 


de la vitesse du point représentatif. Cette ti. est dite vitesse 
de phase. 
Dans le plan gp, toute solution de l’équation (10) 


g = q(t), = D (1) 


détermine une certaine trajectoire suivant laquelle se déplace le 
point représentatif. Cette trajectoire s'appelle trajectoire de phase. 
(Il ne faut pas confondre les trajectoires de phase et les vitesses 
de phase avec les trajectoires et les vitesses des points réels du sys- 
tème matériel considéré.) L'équation différentielle qui détermine 
les trajectoires de phase peut s'obtenir sous une forme explicite 
en éliminant la variable £{ des équations canoniques (10). Cette 
équation s'écrit : 


(8.10) 


m” (q) ; 
dp TI p?—V"(9)+0Q (q, p) 


pr SRE RS ' (8.11) 
m (q) 


L'intégration de (11) donne une équation de la famille des courbes 
intégrales 


p=p(g; C) (8.12) 
qui dépend du paramètre C. 
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Si l'équation (11) est intégrée, le temps pendant lequel le point 
représentatif parcourt la trajectoire de phase est déterminé par 
une quadrature. En effet, la première équation (10) et l'équation 
(142) entraînent 


dt = ro | (8.13) 
d'où l'on tire 
_ {ra 8.1 N 


où C, est une constante arbitraire. Pour déterminer les constantes 
arbitraires Cet C, il faut se donner les conditions initiales, c’est-à-dire 
les valeurs q et p à l'instant initial £ — t,. C’est ce qui détermine 
la loi du mouvement du système. 

Si avec le temps £ qui varie de — o à œ le point représentatif 
parcourt toute la courbe intégrale (12) qui correspond à une valeur 
fixe du paramètre C, cette courbe intégrale est une trajectoire 
de phase. Des cas sont pourtant possibles (décrits dans ce qui suit) 
où la courbe intégrale est composée de plusieurs trajectoires de 
phase, c’est-à-dire { variant de — o à , le point représentatif 
ne parcourt qu'une seule branche de la courbe intégrale (12). 

Les points (g*, p*) du plan de phase en lesquels les deux com- 
posantes de la vitesse de phase e et + ce s'annulent simultanément, 
s'appellent points singuliers. Ce sont 1 points où l'é équation (11) 
ne définit pas la pente de la trajectoire de phase par rapport à l’axe 
des abscisses, du fait que d’après (11) aux points (q*, p*) on a 
dp 0 
dg L” 

Les valeurs (q*, p*) des coordonnées de phase des points sin- 
guliers s'obtiennent à partir des équations finies 


(8.15) 


_m”(q) _ , 
2m (q) P° — V (g) +Q (a; p)= 
Puisque la fonction m (q) ne peut prendre que des valeurs fi- 
nies positives (la fonction m (q) est la masse réduite du système), 
la première équation (15) donne 


p* = (8.16) 


c'est-à-dire les points singuliers reposent sur l'axe des abscisses 
du plan de phase. La deuxième équation (15) et la relation (16) 
entraînent que les abscisses g* des points singuliers sont les racines 


de l'équation 
— V'(g9) +0 (a, 0) = 0. (8.17) 


$ 8] MÊTHODES QUALITATIVES D'ÉTUDE DU MOUVEMENT 113 


L'état du système 
g = qg* = const, p=p* =0 (8.18) 
constitue une solution particulière des équations canoniques du 
mouvement (10) du système. Cette solution particulière correspond 
à la position d'équilibre du système considéré. Ainsi, les points 
singuliers déterminent la position d'équilibre du système. 

A l'exception des points singuliers, la vitesse de phase diffère 
du zéro quel que soit le point du plan de phase, c’est-à-dire le point 
représentatif parcourt la trajectoire de phase sans marquer d'arrêt. 
Aux points d’intersection de la trajectoire avec l’axe des abscisses 
(points réguliers) on a d'après (11) 


(SE), ,=0. (TE) #0. (8.19) 


Ainsi la trajectoire de phase coupe l’axe des abscisses en un point 
régulier (c'est-à-dire non _singulier) sous un angle droit et se situe 
d'un côté par rapport à la tangente verticale. 

_ Comme m (g) =>0, dans le demi-plan supérieur du plan de phase 


q > 0; la trajectoire de phase est suivie dans le sens des valeurs 


croissantes de q. Dans le demi-plan inférieur q << 0 et la trajectoire 
est parcourue dans le sens des valeurs décroissantes de gq. 

2. Systèmes conservatifs. Si les forces appliquées à un système 
possèdent un potentiel, c’est-à-dire si elles sont déterminées par 
l'expression — VW” (q), et si ce système ne subit pas l’action 


d’autres forces 
Q(q, p,t)= 0, (8.20) 


un tel système s'appelle conservatif. 
Conformément à (8) les équations canoniques du mouvement 
d'un système conservatif à un degré de liberté sont 


dg _oH 

dt op’ 

dp_ ôH (8.21) 
dt  0q° 


En tenant compte de l'expression (7) de la fonction de Hamilton 
H, ramenons l'équation (21) à la forme 


ig _ _P_ 
dt m(q)° 
8.22) 
= _m” (q)_ ; ( 
= im QE PV’ (o). 


Comme d’après (21) 
dH _OH dq 0H dp = 0, 
d 09 dd 'p&t 
8—0393 
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on a la première intégrale (intégrale d'énergie) 


H = const, (8.23) 
qui d’après (7) peut être mise sous la forme 
P° _ 
me + V()=v. (8.24) 


Ici v est la valeur de l'énergie totale du système, qui peut être dé- 
terminée à partir des conditions initiales: q = qg (to), p = p (to) 
avec ? = Lo. 

La relation (24) peut être considérée comme une équation finie 
des trajectoires de phase dépendant du paramètre v. Comme il suit 


de (24) 
p = + 2m (q) Lu — V (q)l, (8.25) 


c’est-à-dire les trajectoires de phase d’un système conservatif sont 
symétriques par rapport à l’axe des abscisses. 


Fig. 8.1 


En vertu de (14) et (25), le temps nécessaire à un point repré- 
sentatif pour se déplacer du point d'abscisse g, au point d’abscisse 
g de la trajectoire de phase (fig. 8.1) est 


q 
V m (a) dq 

L= y ————_—_— "| 2 

&} V21v—v (a) EE 
0 

Dans l'expression (26) le signe supérieur devant l'intégrale correspond 

au cas où le point représentatif se déplace suivant l'arc situé dans 

le demi-plan supérieur, et le signe inférieur, suivant l’arc situé 

dans le demi-plan inférieur. 

Un exemple des trajectoires de phase d’un système conservatif 
est donné par la figure 8.2. En partant de la courbe donnée de la 
fonction V (q) (fig. 8.2, a), on a construit ici les courbes des fonctions 
p® — 2m (q) lu; — V (a)l (fig. 8.2, b) aux différentes valeurs 
vi (i — À, ..., 5) de l'énergie totale du système. Ces courbes ont 
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permis de construire sur la figure 8.2, c les trajectoires de phase asso- 
ciées aux valeurs uv, (i — 1, . . ., 5) de l'énergie totale du sys- 
tème, données par la figure 8.2, a. 

Considérons l’allure des mouvements du système qui correspon- 
dent aux différentes trajectoires de phase visualisées par la figu- 
re 8.2, c. Aux points À, B, C, où la fonction V (q) a son extrémum, 
correspondent des points singuliers 
repérés respectivement sur la figu- 
re 8.2, c par les chiffres 2, 4 et 1. 
Comme nous avons dit plus haut, les 
points singuliers déterminent Ja 
position d'équilibre du système. 

En À la fonction V (q) possède un 
minimum. Le point singulier 2 qui 
lui correspond est un point singulier 
isolé. Ce point s’appelle sommet. Si à 
l'instant initial le point représentatif 
est assez proche du point singulier 2, 
il parcourt, comme le montre la figu- 
re 8.2, c, une trajectoire de phase fer- 
mée reposant dans un voisinage assez 
proche du point 2. Un continuum de 
trajectoires de phase fermées associées 
au paramètre v, et analogues à 3 cou- 
vre le domaine tout entier du plan de 
phase délimité par la courbe fermée 4’. 
Ainsi, la position d'équilibre qui cor- 
respond à un point singulier du type 
sommet est stable, ce qui vérifie le Fig. 8.2; 
théorème connu de Lejeune-Dirichlet. ù 

En B la fonction V (q) possède un maximum. Le point singulier 
4 qui lui correspond est celui par lequel passe la courbe 4’’’4’4” 
qui se coupe et qui s'appelle séparatrice. Le point singulier 4 se 
nomme col. La séparatrice se compose de trois branches 4’’”, 4’ 
et 4”. Comme nous allons le montrer plus loin, en parcourant une 
séparatrice quand { —+ co, le point représentatif s'approche asympto- 
tiquement du point singulier 4. C'est pourquoi chacune des branches 
isolées de la séparatrice (4°"”, 4” et 4”) susmentionnées est une tra- 
jectoire de phase. De plus, la trajectoire de phase 4’’’ est parcourue 
en un mouvement infini limilé (pour t—+ oo, q—>gq; pour 
t—> — oo, qg—> ©). La trajectoire de phase 4” est parcourue en 
un mouvement limité infini (pour { —+ ©, q —+ ©; pour {—> — oo, 
q — q). La trajectoire de phase 4’ est parcourue en un mouve- 
ment limité double (pour { —+ ©, q + q;; pour { — — 00, q —+ q). 

Si à l'instant initial le point représentatif se trouve aussi près 
que l’on veut du point singulier 4, il suivra alors, comme on le 


8% 
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voit sur la figure 8.2, c, l’une des trajectoires de phase du type 
3, 5 ou 3”, mais comme pour le mouvement suivant les trajectoires 
de phase du type 5 et 3° q + œ lorsque ?£ —+ co, la position d’équi- 
libre associée au point singulier 4 (c'est-à-dire au point singulier 
du type col) est instable. 

En C la fonction V (q) a une valeur stationnaire. Le point singulier 
1 qui lui correspond est (comme nous le montrons dans ce qui suit) 
un point de rebroussement de première espèce. Ainsi qu'il ressort 
de la disposition des trajectoires de phase de la figure 8.2, c, la 
position d'équilibre relative au point singulier Z est également 
instable. 

La séparatrice qui passe par le point singulier Z est composée de 
deux branches 7’ et 2” dont chacune est une trajectoire de phase du 
système. La trajectoire de phase 7” est parcourue en un mouve- 
ment infini limité (pour {—> ©, q —+ Q,; POUr { —> — 00, qg —> co). 
La trajectoire de phase 7” est suivie par un ee limité infini 
(pour t—+ 00, qg—> ©; pour £—> — 00, q—> q). 

Les trajectoires de phase du type 9, 3". Ty correspondent aux 
mouvements infinis doubles (pour t —> oo, q — co; pour { —> — co, 
q —+ oo). 

La trajectoire de phase 3 est une courbe fermée. En tout point 
de cette trajectoire la vitesse de phase est différente du zéro; le 
point représentatif suit la trajectoire 3 sans s’arrêter et effectue 
un tour en un intervalle de temps fini. La trajectoire 3 correspond 
à un mouvement de libration (pulsé) du système. 

Déterminons maintenant la pente d’une trajectoire de phase 
par rapport à l’axe des abscisses en un point singulier. L'expres- 
sion (25) conduit à 


dp m’ (q) [v—V (g)}]— m (g) V” (q) 
dq 2m (q)Lv—V (g)] en 


Nous avons montré ci-dessus (16) qu’en un point singulier p = (0. 
D'après (17), dans un système conservatif, V” (q) s'annule en un 
point singulier. Ainsi, en tenant compte de l'expression (25), on 


a les relations: 
vu = V (g*), V”" (g*) = 0, (8.28) 


où g* est l’abscisse du point singulier. 
Soit u l’ordre de la plus petite des dérivées de V (q), différente 
de zéro au point singulier 
pu (9°) # 0. 


On peut alors mettre pr" fonctions V (q) et V” (g) sous la forme 
V(a)=V é + 1V#(a*) + e (a)1 (a— 9°)", 

(8.29) 
Vo = pr (@°) + n (gt, 
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où les fonctions e (g) et n (g) s’annulent en q = q*: 


e(g*)=0, n(g*) = 0. (8.30) 
Conformément à (29), l'expression (27) peut être récrite 
dp À 
Bt — LE  _—, (8.31) 


ts]e 


V —2m (q) P (g—g*) 


avec 


x . L 1 % 
P = IVe (@g°)+e(@), =; [V0 (a) + n Go), | (8.32) 


R = —m'(g) F (g—g°)" —m (q) G(g—g*}"". 


Il résulte de la relation (28) que u > 2. Lorsque u = 2 et 
V" (g*) > 0, la fonction V (q) possède en qg = qg* un minimum, 
et par suite, le point p = 0, q = q* est un point singulier isolé. 

Dans le cas où u = 2 et V” (q*) << 0, la fonction V (q) possède 
un maximum en g = g*. Le point p — 0, q = q* est un point 
singulier du type col. On a alors d’après (31) 


lim MER = —m(g)v("). (8.33) 


Comme dans le cas considéré V” (qg*) < 0, l'expression sous le 
signe de la racine de (33) est positive et À est une valeur réelle. 


P P 
, 
0 . = 
g 0 >< 1 
Fig. 8.3 Fig. 8.4 


Ainsi, nous sommes ici dans le cas où la séparatrice qui passe par 
le point singulier se coupe en ce point (fig. 8.3). Pour pu > 2 pair 
(1 = 4, 6, 8, ...,) et Vu) (g*) 0, la fonction V (q) possède 
en g = g* un maximum. Dans ce cas on a, d’après (31), 


é dp 
da (8.34) 


et, par conséquent, une auto-ausculation de la séparatrice qui passe 
par le point singulier (fig. 8.4). Si u > 2 et est un nombre impair 
(u = 3, 5, 7, ..., ), en qg — q* la fonction V (q) possède un mi- 
nimax. Dans ce cas, en vertu de (31), 


lim #2—0, (8.35) 
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et le point singulier est un point de rebroussement de première 
espèce. La séparatrice qui passe par le point singulier est représentée 
sur la figure 8.5 

Déterminons maintenant le temps nécessaire au point repré- 
sentatif pour se déplacer suivant la séparatrice du point d’abscisse 
g = 4, au point singulier d’abscisse q = g* (fig. 8.6). Supposons 
qu'à l'instant £ = t, le point représentatif se trouve sur la branche 


0 g 4 


Fig. 8.5 Fig. 8.6 


de la séparatrice dans le demi-plan supérieur au point d’abscisse 
do D'après (26) le temps nécessaire au point représentatif pour 
atteindre le point singulier est 


ANS 
t — | __Vm (gag (8.36) 
2{(v—V (9)] 


En portant dans (36) l'expression (29) qui détermine la fonction 
V (q), on obtient 


qg* 


= | Vm (a) dq 


EE — (8.37) 
ms 
do V -<+ivu (a*)+e (9) (g— g*) 2 


Puisque = >1, l'intégrale impropre (37) est divergente, et, par suite, 


comme nous l'avons dit plus haut, avec { —+ co, le point représenta- 
tif s'approche asymptotiquement du point singulier. 

3. Systèmes dissipatifs. On appelle dissipatifs les systèmes sou- 
mis, en plus des forces conservatives, à des forces dissipatives, c’est- 
à-dire à des forces dont l’action disperse l'énergie du système. 

Considérons un système à un degré de liberté dans lequel 


m (q) = m —= const, (8.38) 
V (D => ca, (8.39) 
Q (g, p) = — cB sign p — 2ep. (8.40) 


La force supplémentaire Q (q, p) est la somme des forces de frotte- 
ment sec et de frottement visqueux. 
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D'après (10), les équations canoniques du mouvement du sys- 


tème sont 
2q _ P 
dt m ? 
is | (8.41) 


— = — cq— cB sign p— 2ep. 


Le système d'équations différentielles (41) peut être remplacé par 
une équation différentielle du second ordre 

q = — cq — cB sign q — 2emg. (8.42) 
En désignant 


=, (8.43) 

mettons l'équation (42) sous la forme 
(a+ B)+2e (a+ B)+K(g+B)=0 (pour 9>0), (8.44) 
D (g—B)+2e + (9—B)+k(g—B)=0 (pour g<0). (8.44) 


Etudions le mouvement du système sous les conditions initiales 
suivantes 

g=a>0, g—=0 pour t1—=0. (8.45) 

Pour passer à la définition de la loi qui régit le mouvement du 

système, supposons qu’à l'instant qui suit l'instant initial le 


système se déplace avec q < 0, c’est-à-dire que le point représenta- 
tif se déplace dans le demi-plan inférieur du plan de phase. On 
a alors l'équation (44') 


D (g— B)+ 2e + (g— B)+ 2 (g— B)=0. 


Une fois cette équation intégrée, il faut justifier l'hypothèse d’après 


laquelle q << 0 et déterminer l'instant où le point représentatif 
passe dans le demi-plan supérieur. 
Sous la condition e << k, les racines de l'équation caractéristique 


À + 2eù + k° = 0 (8.46) 
sont 
An À = —Ee+io, © = Vk?— ef. (8.47) 
Sous les conditions initiales (45), la solution de l'équation diffé- 
rentielle (44°) s'écrit 


g(t)}=B+(a;—B)e-ttcos ot ++ (aj—Bje-ttsinwt. (8.48) 
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On en tire 
g(9=—(+&) (a;— B)e-#tsin ot. (8.49) 


L'expression (49) montre que g<0 dans l'intervalle de temps 
O<t<t, où 
h=+, (8.50) 
ce qui justifie par conséquent l'hypothèse que le mouvement du 
point représentatif à l'instant qui suit l’instant initial a lieu dans 
le demi-plan de phase inférieur. 
Ainsi, l'expression (48) détermine la loi du mouvement du sys- 


tème dans l'intervalle de temps 0 <1t< L. À l'instant t, =* : 


la vitesse généralisée gq (t,;) — O et le point représentatif coupe 
l'axe des abscisses pour passer dans le demi-plan de phase supérieur. 

Il résulte de (48) que la valeur de la coordonnée généralisée 
g à l'instant £, est 


| q (ts) = B — (aj— B) B, (8.51) 

où 
x 
En introduisant les notations 
am=B[a-B(1++)], (8.53) 
on obtient d’après (54) 
g (D = — ah. 
Si l'écart initial a, > B (1 +5), il vient 
Gj+1 > 0. 


Le mouvement ultérieur du point représentatif s'effectue dans 
le demi-plan F phase ___. c'est-à-dire on vérifie l'équation (44) 


À (a+ B)+ 2e (g+ B) +R (+ B)= 0. (8.54) 


Cette équation doit être rs sous les conditions initiales sui- 
vantes : 


q — — aj4t LO, q= O0 pour t=th=— (8.55) 
La solution de (44) sous les conditions initiales (55) s'écrit 


qg(t)=—B—— (054 — B)e-t-#41) sin © (t—4) — 
— (a;x1—B)e-et-tcosw(t—t;). (8.56) 
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L'expression (56) conduit à 
q(t)= (+ w) (ay— Bje-ttt-19 sinw(t—t4). (8.57) 


Il résulte de l'expression (57) que g>0 dans l'intervalle 
t <t<ts, où 


97 
=, (8.58) 


et dans cet intervalle l'expression (56) définit la loi du mouvement 
du système. 


A l'instant z,, la vitesse généralisée q (t.) = 0 et le point repré- 
sentatif, en passant par l’axe des abscisses, se déplace dans le demi- 
plan inférieur. 

D'après (56), à l'instant £., la valeur de la coordonnée généra- 
lisée qg est 


q (ta) = ajye, (8.59) 


« 


ou 


au=B[eu—8(1++)]. (8.60) 


L'expression (60) montre que si a;,;, > B (1 + 5) » gts) > 0. 


Les grandeurs @;, @j;,, Gj42, . . . sont les valeurs absolues 
des abscisses des points d’intersection consécutifs de la trajectoire 
de phase avec l’axe p — 0. Appelons ces grandeurs amplitudes 
successives. La comparaison des expressions (53) et (60) révèle que 
la formule associant deux amplitudes successives est la même dans 
le cas du point représentatif passant du demi-plan supérieur dans 
le demi-plan inférieur ou inversement. 

Si on désigne maintenant par a, l’amplitude initiale, on obtient 
d’après (53) et (60) une suite d’amplitudes déterminées par les 
relations 


di = fao — B (1 + B), 
lo = Ba; —B (1 + B), 
az = Pa: — B(1+8), (8.61) 


An-1 = Ban-e — B (1 + B), 
an = Pan-1 — B (1 +Ê). 
Montrons maintenant que le mouvement du système s'effectue 


en un intervalle de temps fini et cesse à l'instant où le point repré- 
sentatif tombe sur le segment [— B, + B] de l’axe des abscisses 
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du plan de phase (fig. 8.7). Le segment [— B, + B] de l’axe des 
abscisses du plan de phase s'appelle zone inefficace du système. 
En effet, en un point quelconque de ce segment, |g | < B et la 
force de rappel cg est équilibrée par le frottement sec. Comme sur 


l'axe des abscisses q = 0 et le frottement visqueux — 2emg s’annule, 
lorsque le point représentatif passe 
dans la zone inefficace, la force de 
rappel cq est compensée par le 
frottement sec d'équilibre, et le 
mouvement s'arrête. Puisque, com- 
me il en résulte des formules (53) 
et (60), avec chaque demi-oscilla- 
tion l'amplitude des oscillations 
décroît à une grandeur dépassant 
2B, quelle que soit l'amplitude 
initiale a,, après un nombre fini de 
demi-oscillations l'amplitude du 
système prend une valeur plus petite que B et le mouvement 
s'arrête. Ainsi, le mouvement du système s'effectue en un intervalle 
de- temps fini. 

Considérons maintenant les relations (61). Désignons par » le 
nombre de demi-oscillations au cours desquelles s'effectue le mou- 
vement, pour obtenir (fig. 8.7) 


An < B. (8.62) 


En multipliant la première relation (61) par B"-!, la deuxième 
relation par B"-*, etc., et en additionnant respectivement les pre- 
miers et les seconds membres des relations obtenues, il vient 


an = Bao— B(1+8")—2BB(1+B+ +82) 


Fig. 8.7 


1—pn-1 
1—B 
Lorsque e& = 0, c'est-à-dire si les forces dissipatives appliquées 
au système ne sont composées que de celle du frottement sec, on a 


An = Paso — B(1+ 6") — 2B$ 


(8.63) 


: 1—pr-1 _— 
B=1, RE ET =n—1, (8.64) 
et la formule (63) devient 
An = ap — 2Bn. (8.65) 


Mais si le système considéré ne comporte pas de forces de frotte- 
ment sec (B = 0), la formule (63) se met sous la forme 


an —= P'&. (8.66) 
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En l'absence du frottement sec, le système ne possède pas de zone 
inefficace et ses oscillations libres s’amortissent asymptotiquement 
pour { —+ co. 

D'après les expressions (48) et (56) la demi-période des oscilla- 


tions du système vaut L_. La période des oscillations du système 
s'écrit 


27 
TS - (8.67) 


On voit de l’expression (67) que les forces de frottement sec n’inter- 
viennent pas dans la grandeur de la période des oscillations libres. 
Toutefois, nous n’avons démontré ce résultat que pour les systèmes 
à un degré de liberté. 

4. Systèmes à auto-oscillations. Méthode des transformations ponc- 
tuelles. Passons maintenant à l'étude des systèmes soumis, en‘plus des 
forces à potentiel et des forces dissipatives, aux forces dont l’action 
restitue l'énergie du système. D'après Kelvin ces forces sont dites 
artificielles. La présence des forces artificielles suppose que le 
système soit lié à une source d'énergie extérieure, ces forces artifi- 
cielles assurant l’utilisation de l'énergie de la source extérieure 
pour restituer les pertes d'énergie du système. 

Si les forces dissipatives ou les forces artificielles (ou encore les 
unes et les autres) sont des forces non linéaires, le système peut don- 
ner lieu à des oscillations périodiques dont les paramètres ne dépendent 
pas des conditions initiales mais s'établissent automatiquement de fa- 
çon que l'accroissement de l'énergie du système en une période d’oscil- 
lations soit nul. Les oscillations périodiques considérées (on les appelle 
également mouvements périodiques) sont des solutions particulières 
périodiques asymptotiquement stables des équations différentiel- 
les du mouvement du système. Outre ces solutions, les équations 
du mouvement du système peuvent avoir des solutions particulières 
périodiques instables. Les mouvements périodiques asymptotique- 
ment stables s'appellent auto-oscillations ; les systèmes non linéaires 
qui donnent lieu aux mouvements de ce type se nomment systèmes 
à auto-oscillations. Parmi les systèmes bien étudiés de ce type il 
y a les montres, les oscillateurs à tubes, etc. 

Dans ce qui suit nous examinerons les propriétés caractéristiques 
des systèmes à auto-oscillations sur l’exemple d'un oscillateur 
à tubes. 

Les oscillateurs à tubes sont prévus pour générer dans un circuit 
électrique des oscillations entretenues, c'est-à-dire du courant 
alternatif haute fréquence. Ils s’emploient surtout en radiotechni- 
que. Ce type d'oscillateur est schématisé figure 8.8. La source d'’é- 
nergie extérieure est une batterie d’anode Æ, qui alimente un tube 
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électronique (triode). Le circuit oscillant RLC est intercalé dans 
le circuit anodique du tube. Le circuit de grille comporte une bobine 
de self. Le coefficient d'induction 
mutuelle des selfs dans le circuit 
de grille et le circuit anodique 
est noté M. Comme nous le mon- 
trons plus loin, la liaison entre le 
circuit anodique et le circuit de 
grille, assurée par l'induction 
mutuelle, effectue le dosage de la 
restitution (à partir de la bat- 
terie d’anode) de l'énergie dans 
le circuit RLC de façon à com- 
penser les pertes d'énergie dans 
la résistance ohmique et à entre- 
tenir les oscillations. 
Fig. 8.8 Pour composer une équation 
différentielle à laquelle satisfait 
l'intensité du courant g dans la branche LR du circuit oscillant, 
déterminons la tension U sur l’armature du condensateur. En dé- 
signant par i, le courant anodique, on a 


{ 
U=+ | liatt)—q(r)] dr. (8.68) 
0 


—— 
la”q 


Comme cette grandeur est égale à la chute de tension dans le self 
L et dans la résistance ohmique À, on a la relation 


d 
U=L + Rq. (8.69) 
Les relations (68) et (69) entraînent 


{ 
Lg+Rg= + | lis (r)—g(r)] dr. (8.70) 
0 


En dérivant par rapport à t{ les premier et second membres de la 
relation (70), on obtient l'équation différentielle suivante: 


q + 2eq + kg = Kia, (8.71) 
ou 
4 R 1 
RE (8.72) 


Le courant anodique i, est fonction de la tension de commande : 
ia = f (u). (8.73) 
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La courbe de la fonction f (u) s'appelle caractéristique du tube. 
La tension de commande w est de la forme 


u = Us, + YU, (8.74) 


où U, est la différence de potentiels entre la grille du tube et la 
cathode, et U,, la différence de potentiels entre l’anode et la cathode. 
Par + on désigne la perméabilité du tube. La courbe caractéristique 


Fig. 8.9 Fig. 8.10 


du tube est donnée figure 8.9. Avec l'augmentation de x le courant 
anodique i, s'approche asymptotiquement du courant de saturation 
dont la valeur est désignée par S. 

Les paramètres d’un oscillateur à tubes sont généralement tels 
que la relation (74) peut être approximée de la façon suivante: 


u & Uy. | (8.75) 


Pour simplifier les calculs, approximons encore la courbe caracté- 
ristique de l'oscillateur par une fonction en escalier visualisée 
figure 8.10. On peut montrer qu’en remplaçant la caractéristique 
du tube par une fonction en escalier on ne déforme pas l'allure des 
solutions de l'équation différentielle (71). Lorsque la nécessité 
se présente, on peut préciser les solutions obtenues en approximant 
la caractéristique du tube (fig. 8.9) par une ligne brisée. 

L'approximation de la courbe caractéristique d’un tube par une 
fonction en escalier, en tenant compte de (75), donne 


._. {S pour U,>0, 
8] 0 pour U,<0. 


Puisque l'induction mutuelle des selfs fait que dans le circuit de 
grille et le circuit anodique 


(8.76) 


Us=M<E, (8.77) 


la relation (76) peut s’écrire 
-{ pour g>0, 


: (8.78) 
O0 pour g<(. 
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De cette façon l'équation différentielle (71) devient 
kK2S pour g>0, 
O pour g<0. 


Passons à l'intégration de l'équation (79), cette intégration 
s'effectuant par rapport aux intervalles de temps pendant lesquels 


la fonction q (t) garde son signe constant. Soit 


q + 2eq + k2q -{ (8.79) 


g=a>0, g=0 pour t — 0. (8.80) 


Comme dans le mouvement à l'instant qui suit t = 0 q (4) est né- 
. gatif (ce qui sera confirmé ci-dessous), il faut, conformément à (78), 
faire appel à l'équation 


q + 2eq + kg = 0. (8.81) 


Sous réserve que 
e <k, 


la solution de l'équation (81) qui vérifie les conditions initiales 
(80) est 


q (t) =— ee! sin of + ae-tt cos w!, (8.82) 
où 
O — Ve. (8.83) 
On tire de l'expression (82) que 
q(t) = — (+ w) ae-tt sin wi. (8-84) 


Ainsi l’expression (82) détermine la loi du mouvement du sys- 
tème dans l'intervalle de temps 0<t<t,, où 


h=—, (8.85) 
puisque, d’après (84), dans cet intervalle q (4) << 0, ce qu'on a sup- 
posé en recourant à l'équation (81). 
D'après (82), à l'instant £ = 4, les fonctions q (+) et q (t) prennent 
les valeurs suivantes: 
q(ts)= —$a, q(t)=0, (8.86) 
avec 


EL 4 
B—e v<1. (8.87) 


En adoptant les notations 


b —"fa, (8.88) 
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on obtient d’après (86) | 
q (1) = — b. (8.89) 


Dans l’intervalle de temps qui suit £,, q (£) est positif et, d’après 
(79), dans cet intervalle on a l'équation 


q + 2eq + kg = KES, (8.90) 
qu'il faut intégrer pour les conditions initiales 
g= —b<0, g=—0 pour t=t=—+—. (8.91) 


Voici la solution de l'équation différentielle (90) vérifiant les con- 
ditions initiales (91) 
q(t}=S—(b+S)e-et-4) cos &@ (ft —t1) — 


—+ (b+S)e-ett-i) sin@(t—t;). (8.92) 


Il résulte de l'expression (92) que 


q (t) = (= +0) (b-S) e-"tt-41) sin w (t— ti). (8.93) 
(93) entraîne que q> 0 dans l'intervalle de temps £, 1 <t, où 
h= +, (8.94) 


ce que nous avons avancé en appliquant l'équation (90). Ainsi 
l'expression (92) définit la loi de variation de q dar: l’intervalle 
de temps 4 <<. 


A l'instant t = 4, q (t) s'annule 


q (ts) = 0. (8.95) 

D'après (92), la valeur de q(t) à l'instant & = t, s'écrit 

: gts) = 0, (8.96) 
où 

c = Bb + (1 + B)S. (8.97) 


Si l’on pose que gq et qg sont les coordonnées de phase”du système, 
on peut construire dans le plan de phase (fig. 8.11) la trajectoire 
du point représentatif, déterminée par les expressions (82), (84), 
(92) et (93). 

Nous avons examiné un cycle du mouvement du point repré- 
sentatif dans le plan de phase (fig. 8.11) et établi les relations (88) 
et (97) entre les amplitudes consécutives a, bet c de ce cycle. On voit 
aisément de ce qui a été énoncé ci-dessus que ces relations ont lieu 
également pour les cycles qui suivent, si, certes, par a, b, c on entend. 


128 SYSTEMES COMMANDES NON LINÉAIRES [CH. 3 


les amplitudes correspondantes du cycle successif considéré. En 
introduisant les notations 


ha (a, b) — b — Ba, | (8.98) 
fac, b) = Bb—c+(1+PB)S, 
les relations (88) et (97) peuvent se mettre sous la forme 
fa (a, b) — 0, 


Les relations (99) peuvent être considérées comme les formules 
de la transformation ponctuelle qui transforment tout point a; 


b 


MAS À 


Fig. 8.11 Fig. 8.12 


de l’axe des abscisses du plan de phase en point c; de ce même axe, 
où à est le numéro du cycle décrit par les expressions (82) et (92). 
Les équations (99) peuvent également être considérées comme celles 
des droites dans les plans ab et cb respectifs (fig. 8.12). Si l’on fait 
coïncider les plans ab et cb, ces droites se coupent au point dont 
les coordonnées sont 


a=c—= A, b = B. (8.100) 
Les valeurs de À et de B déterminées d’après les équations 
B— BA = 0, | 
BB — À Hot | 6:09 
sont 
A=T =. (8.102). 


Le point qg — À de l'axe des abscisses est le point invariant 
de la transformation ponctuelle déterminée par les relations (99). 
Si a = À, en suivant la trajectoire de phase, le point représentatif, 


$ 8] MÊTHODES QUALITATIVES D'ÉTUDE DU MOUVEMENT 129 


une fois le cycle réalisé, revient en qg — À (puisque c — À), c'est- 
à-dire décrit dans le plan de phase une trajectoire fermée (fig. 8.13). 
Ensuite, le point représentatif se déplace en décrivant la même 
trajectoire de phase, c'est-à-dire la variation de la fonction gq (t) 
est régie par une loi périodique. Notons que les grandeurs À et B 
ne dépendent que des paramètres du système et non des conditions 


Fig. 8.13 Fig. 8.14 


initiales du mouvement. C'est là une différence capitale entre Île 
mouvement périodique que nous avons décrit et les mouvements 
de libration d’un système conservatif. 

La courbe de la fonction gq (t) associée à une trajectoire de phase 
fermée (fig. 8.13) est représentée figure 8.14. Puisque d'après (102) 
B < À, les oscillations sont centrées non pas sur le point q = Ü 
mais sur un certain point qg* > 0. En amenant à la grille du tube 
(fig. 8.8) une tension continue supplémentaire (polarisation), on 
peut obtenir une trajectoire de phase fermée symétrique par rapport 
à l'axe des ordonnées du plan de phase. 


Etudions maintenant le mouvement du point représentatif 
dans le voisinage d’une trajectoire de phase fermée. Soit 


a = À + ba. 
Alors, il vient 


b = B + 6b, c = À + ôc. 

Les relations (99) qui relient les amplitudes successives deviennent 
| f. (4 + ôa, B + 6b) = 0, 

fa (A + ôc, B + 6b) = 0. | 


En développant les premiers membres des relations (103) en séries 
de Taylor dans le voisinage du point (4, B) on a 


fi(4, B)+(<%) ôa+ (5) 6b+...—0, 
B B 


(8.103) 


n= 


a (8.104) 


9—0393 


130 SYSTÈMES COMMANDÉS NON LINÉAIRES (CH. > 
RE 


En se bornant aux membres du premier ordre par rapport aux 64. 
6b et Ôc, et en tenant compte que d’après (101) 


f (4, B) —0, j:(4, B) = 0, (8.105) 


on obtient les relations suivantes: 


(5), 8e+ (+) 6b—0, 
B 


a—=A 
= b=B 
8.106) 
Ôfs Ôfe À 
(5)... 8 +( ob )._ 6b — 0 
b=B b=—B 
Puisque d'après (98) 
fs fs fe fs _ 
+ = —h, = , dc = —1, 5 =; (8.107) 
les relations (106) deviennent 
— Bôa + 6b — 0, | 
— 6e + B5b = 0. (8.108) 
D'où 
ôc = B'ôa. (8.109) 


On voit de la figure 8.11 que si par a; on entend l'amplitude 
initiale du i-ième cycle, c; sera alors l’amplitude initiale du (i + 1)- 
ième cycle, c’est-à-dire 


Ci = Œitye (8.110) 
On en déduit que 
Ôc; = Ôa;+1- (8.111) 
Par suite, la relation (109) peut être récrite 
Ôa;+1 —= B“0a;. (8.112) 


La relation (112) est une équation aux differences finies linéaire 
par rapport à la variation de l’amplitude ôa. Le numéro du cycle 
i constitue la variable discrète de la fonction ôa recherchée. 

Comme d'après (87) B << 1, il vient 


lim Ôôa; = 0, 

1— 00 
d’où l’on tire que les trajectoires de phase s’approchent asympto- 
tiquement de la trajectoire de phase fermée déterminée par les 
grandeurs (102) et représentée figure 8.13. La trajectoire de phase 
considérée présente ainsi un cycle limite stable. 

Ce cycle limite détermine précisément les auto-oscillations géné- 

rées par un oscillateur à tube. 
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$ 9. Systèmes non linéaires soumis à des forces 
périodiques extérieures 


1. Oscillations forcées d’un système non linéaire. Considérons 
un système non linéaire à un degré de liberté dont la masse réduite est 


m (q) = m = const. (9.1) 


Dans ce cas les équations canoniques du mouvement (8.9) s’écrivent 


L'RE 
En | (9.2) 
= —V'(g)+Q(a, p, t). 
Soit 
—V'(D+Q0( p, D =ml—/f(g 9 +vp(v)l, (9.3) 


où + (vi) est une fonction périodique de période 


PT. (9.4) 


Le système d'équations différentielles (2) peut être remplacé par 
une équation du second ordre 


a +1, 9 = (. (9.5) 
Introduisons maintenant les notations ; 
Ÿ = vi. (9.6) 
Comme l'intervalle de temps { égal à une période de la fonction 
4 (vt) fait = , et d’après (6), Ô = vf, la période de la fonction 


4 (8) par rapport à la nouvelle variable Ÿ est égale à 2x. On sait 
qu'en respectant certaines conditions (par exemple, les conditions 
de Dirichlet), la fonction 1 (Ÿ) se développe en série de Fourier 


p(B)=— (oc d+[+ [4 (0) cos © 48 cos 8 + 
Fe E (TC sin o do | sin®+... (9.7) 


La série (7) peut être mise sous la forme: 


d (8) = C + R cos (8 + y) + ..., (9.8) 
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avec 


C=— Jours. | 


r=V ri j (8) cos 9 48 |” +[+ {ve sin à d0 |", 


alors que l'angle y est défini par les relations 


(9.9) 


T JT 
COS ÿ = | Ÿ (Ÿ) cos Ÿ dÜ, siny— + | + (Ÿ) sin Ô dÔ. (9.10) 
EL I d 


Considérons ensuite que la fonction wŸ (8) est symétrique, ce qui 
veut dire que 
C = 0, (9.11) 


et, par suite, 
| v (8) — À cos (8 + y) +... (9.12) 
Examinons d’abord un cas particulier. Soit 
1 (gs 9) = (w°+e?)g+ 
Ÿ (ve) = R cos (8 + y) 
L' équation (5) devient alors 
q fe 2eq + (w° + e°) q = R cos (vt + y) (9.14) 


La solution particulière de l'équation (14) qui correspond à son 
second membre est : 


g = a cos (vit + y — 6). (9.15) 


(9.13) 


Comme d’après (2) p — mg, dans le cas envisage 
°p = — may sin (vt + y — 6). (9.16) 


Ici a est l'amplitude des oscillations forcées et 6, leur déphasage 
par rapport à la phase de la force extérieure 4 (vi). L'équation 
(14) étant une équation linéaire, dans les expressions (15) et (16) 
a — const et 6 = const. 
D'après (2) et (3), dans le cas général les équations du mouve- 
ment s'écrivent 
dq 


P 
À mm! 
(9.17) 
CPU ENS 
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et les expressions 
q = a cos (Ô + y — 6), p — — mav sin (0 + y — 6), (9.18) 
où a — const, 0 — const, ne vérifient pas les équations (17). 
Pour cette raison dans le cas général, nous considérons les expres- 
sions (18) comme des formules de changement des variables en po- 
sant que a et 6 sont de nouvelles variables, c’est-à-dire en posant 
dans les formules (18) 


a = a (t), 6 — 6 (+). (9.19) 


Aussi l'écriture de la solution particulière (15), (16) de l'équation 
linéaire (14) n'est-elle utilisée ici que pour guider le choix des for- 
mules de changement des variables. 

Au lieu de g et p, portons maintenant dans les équations (17) 
les expressions (18) que nous ‘écrirons | 


q{ = a cos u, 
| | (9.20) 
p = — may sin u, 
où 
uU=v+y—-6=-0+y—06.. (9.21) 
Remarquons que d’après (10), y = const et il vient 
u = v — 6. (9.22) 
Ainsi, les équations (17) se ramènent à la forme 
acosu— a (v— 8) sinu= — avsinu, 
_ ; (9.23) 
— av sinu—av(v—6)cosu+ f(acosu, — av sin u)— Ÿ (Ô). 


Pour résoudre les équations par rapport à a et 6, multiplions la 
première équation (23) par cos u, et la deuxième par — 1 sin u et 


additionnons respectivement les premiers et les seconds membres 
des équations ainsi obtenues. Il en résulte une équation dans laquel- 


Je 6 ne figure plus. En multipliant la première équation (23) par 
sin u et la deuxième équation (23) par — cos u, puis en additionnant 
les équations obtenues, on trouve une équation qui ne possède pas 


de a. 
Il en résulte donc les équations suivantes 
: : 1 , ; 
a— —avsin u cos u + mr (acosu, —avsinu) sin u— 
1 ; 
 } (Ÿ) sin u, 


(9.24) 


e A 
Ê= v cos u—— f (a COS U, — av Sin 4) COS u + 


+ 2 (8) cos u. 
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Les équations (24) sont des équations exactes. Pour ramener les 
équations initiales aux nouvelles variables nous n'avons rien sim- 
plifié. L'intégratiôn des équations (24) n’est donc point plus facile 
que celle des équations initiales. Dans le cas général on ne parvient 
pas à intégrer les équations (24) et à cet effet on est obligé de faire 
appel à des méthodes approchées. 


Si l’on se borne aux fonctions f (a, L) , peu différentes des fonc- 


tions linéaires, le système d'équations (24) peut être approximé 
par des équations plus simples, en s'appuyant sur le fait que si les 


fonctions / (9, 2) qui interviennent dans (24) sont voisines des 


fonctions linéaires, les fonctions cherchées a et 6 varient lente- 
ment dans le temps. Cette propriété des systèmes dits systèmes 
pseudo-linéaires est due au fait que la solution en de façon 


continue du paramètre, car si les fonctions f (9, À 2) sont linéaires, 


alors a — const et 8 — const. 

Les seconds membres des équations (24) sont des fonctions 
périodiques par rapport à la variable u et se prêtent au développe- 
ment en séries de Fourier. Etant donné que a et 6 des systèmes 
pseudo-linéaires sont des fonctions du temps à variation lente, les 
solutions de (24) sont influencées surtout par les termes constants 
des séries de Fourier; l’action exercée par les termes oscillatoires, 
c'est-à-dire contenant le premier harmonique et des harmoniques 
supérieurs, est assez faible. 


ou un exemple à titre d'illustration. La solution de l'équation différen- 
tielle 


a + ka = S + À sin vt 
s'écrit 


a(=[ «0 + |" EL D 
Si vSk, il vient 
a(t)= [e (0) + +] ent+i_# (cos vt—+ sin vt) , 


AY 
PEnRe 2 k2 L v2 


Puisque pour v > k on a l'inégalité ->+ , la partie principale de la solu- 
tion est 
a(t) = [< oo] ENT. 


La fonction Asinvt rapidement oscillante influe relativement peu sur la 
solution de l'équation étudiée. 


Compte tenu de cette circonstance, adoptons en première appro- 
ximation les équations qui s’obtiennent en remplaçant dans (24) 
les seconds membres par leurs valeurs moyennes par rapport à u, 
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c'est-à-dire par les termes constants de leurs développements en 


séries de Fourier. On a ainsi les équations de la première appro- 
ximation 


x 


: 1 
Cr | [ — av sin u cos u + 
— HN 


Ù 


+2 f(a cosu, —avsinu)sin up (Ô) sin u | du, 


ÿ—— ( [ v cos? u — Di 


x 


1 à 1 
— 3 f (a cos u, —avsinu)cos u + — 1 (Ÿ) cos u | du. 


) 

Pour calculer les intégrales des seconds membres de (25) con- 
sidérons que a et 6 sont constants, c'est-à-dire nous négligeons 
la variation de ces fonctions en une période. L'ordre de petitesse 
de l'erreur ainsi introduite sera déjà plus élevé. 


Comme 
; x ; a 
+ \sinucosudu=0, == Î v cos? u du =; (9.26) 
x TX 
l'équation (25) peut se mettre sous la forme 
EL 
a = _— Ÿ f(acos u, — av sin u) sinu du— 
7H 
x 
— _ | + (Ÿ) sin u du, 
si rt (9.27) 
05 , —avsin u) cos u du + 


21va 


+-— Le | van au 


Notons maintenant que 


Ed 
1 


FF JoOsinudu= | (8) sin (9 +y—08) 48 = 


2 —X 


=[> 
— L'2rv 


Î w (8) sin © d® | cos (y — 6) + 


136 SYSTÈMES COMMANDÉS NON LINÉAIRES [CH. 2 


+ À 5 (8) cos 0 40] sin (y— 6) = 


= [—R sin ycos (y —0) + R cos y sin (y —8)] — — + sin 0. (9.28) 


D'une façon Dr 


_— 


Î % (Ÿ) cos u du = — — COS 6. (9.29) 


En portant les expressions (28) et (29) dans l'équation (27) on a 


| 
a = Ÿ ta cos — avsinu) sin u du+- sine, | 
si t (9.30) 
= ne Ÿ ta cosu — av sin ) cos u du + cos 06. | 
7 


Introduisons maintenant les notations 


O(v, a) = — 


—— Î ftacos u, —avsinu)sinu du, 


1. | (9.31) 
Y (v, a)= + | f(acosu, —avsin u) cos u du. 


71 
Les équations (30) deviennent alors 


du — aD (+, dx sin 6, 
(9.32) 


D—v— 


Comme nous l'avons déjà dit, les (32) sont des équa- 
tions de première approximation. On les appelle équations raccour- 
cies. La méthode par laquelle on les a obtenues s'appelle méthode 
de la moyenne. 

La construction des approximations plus élevées et la défini- 
tion des conditions de convergence des approximations pour les 
systèmes à r degrés de liberté sont établies par B. Boulgakov dans 
sa monographie [17] qui a guidé l’auteur dans l'exposé des pro- 
blèmes des $ 8 et 9. 

Le développement et la justification des méthodes asymptoti- 
ques de la théorie des oscillations non linéaires, auxquelles se rap- 
porte également la méthode de la moyenne, font entre autres, 
l’objet des travaux de B. Van der Pol, L. Mandelstam, A. Andronov, 
N. Krylov, N. Bogolioubov, Y. Mitropolski [4, 12, 47, 64]. 
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2. Oscillations stationnaires à fréquence de la force extérieure 
et leur stabilité. La solution particulière des équations (32) 


a — a* — const, 
l (9.33) 


60 — 6% — const 


par rapport aux variables initiales correspond d’après (20) à la 
solution suivante 


q = a* cos (vt + y — 60*). (9.34) 


La solution (34) présente les oscillations forcées du système, c’est- 
à-dire les oscillations stationnaires à fréquence v de la force 
extérieure. 

Pour trouver les valeurs a* et 60*, déterminons d’après (32) le 
système suivant des équations finies (en général, transcendantes) : 


— aO (v, a)++ sin0 — 0, 
R (9.35) 
v—WY(v, a)+-— cos 0 — 0. 


Les racines des équations (35) sont précisément les valeurs a* et 0* 
qui nous intéressent. 

En éliminant 6 du système d’équations (35) on obtient l’équa- 
tion suivante par rapport à a: 


[aO (v, a) +[va— a (v, a)F — (£).. (9.36) 
Si l’on désigne 
W(v, a)={aD (v, a)P+{va—a#(v, a)P— (2), (9.37) 
l'équation (36) devient 
W (v, a) = 0. (9.38) 


Pour chaque valeur donnée de v, l'équation (38) permet de trou- 
ver r valeurs (où r est le nombre de racines de l'équation) a; — 
— af (i = 1, ...,r) des amplitudes des oscillations forcées pos- 
sibles lorsque le système subit l’action d’une force extérieure de 
période 2x/v. 

Pour toute valeur a? l'équation (35) permet d'obtenir les valeurs 
sin 0* et cos 6* qui lui correspondent et suivant lesquelles on 
détermine la valeur 6°. 

L'équation W(+v, a) — O0 définit dans le plan va la courbe 
a = a* (v) caractéristique de la relation entre l’amplitude des 
oscillations forcées a* et la fréquence v de la force extérieure. Cette 
courbe s’appelle courbe de résonance. 

Certains types possibles de courbes de résonance sont représen- 
tés figure 9.1. L'expression (37) montre qu'aux points de l’axe 
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des abscisses (a — 0) la fonction W (v, a) prend des valeurs négatives 
kR \2 
W (v, 0) — (5) <(. 
Sur la courbe de résonance la fonction W (v, a) s’annule. L’allure 


continue conduit à la conclusion que la fonction W (v, a) est né- 
gative dans la zone comprise entre l'axe des abscisses et la courbe 


de résonance et positive en dehors de cette zone, comme on le voit 
sur la figure 9.1. 


La relation (38) implique qu'aux points de la courbe de résonance 
dw ôW 0W da 


PTE = er + FE "WW — . (9.39) 
Q e Q « 0W , 
Indiquons maintenant les points OÙ ——S annule. 


1) Soit en un point = 0, _ = 0. Alors, en ce point, en vertu 

aw CL AL ES 

de (39), —— — 0. Ainsi, c'est le point OÙ — 0,—— = 0, c'est-à 
dire c’est un point singulier. 

2) Soit en un point 7 + 0. Sien ce point _ — ©, on a en 


vertu de (39) Le = 0. Par conséquent, nous avons là un point de 


la courbe de résonance où la tangente est verticale. (Sur la figure 9.1 
un tel point est m.) 


En tout autre point de la courbe de résonance, D + 0. De 
plus, comme il s’ensuit de la disposition relative des zones positive 
Lé e e (] e 
et négative de la fonction W (v, a), 7 << 0 seulement aux points 


de l'arc situé au-dessus du point m (fig. 9.1) sur la branche gauche 
de la courbe de résonance. En d’autres points de la courbe de réso- 


oW 
nance, —— > 0. 
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Nous avons déjà dit que les mouvements stationnaires à fré- 
quence de la force extérieure (c’est-à-dire les oscillations forcées) sont 
déterminés par la solution particulière (33) des équations (32). Exa- 
minons maintenant la stabilité de ces mouvements. 

Soient 


a — a* + Ôa, 6 — 0* + 66, (9.40) 
où a* et 60* vérifient les équations (35). 
En portant les grandeurs (40) dans les équations (32) et en 


développant les seconds membres de ces équations en séries de Taylor 
dans le voisinage du point (a*, 6*), on a 


d | 
7 Ôa= —a*® (v, a*)+ 5 sin 6° — 


— [+ aO (v, e)| a + ss cos 0°66 + ..., 


9.41) 
d R | 
F7 60=v— Y(v, at) + cos 0" — [7 W(v, a) ] 8 
_ Tr cos O5 — sin 0*66 + ... 
D'après (35) 
a*O (v, a°) = 5 sin 0°, 
fe (9.42) 
— [va*—a*YF(v, a*)] = 77 COS 6*. 


En tenant compte des relations (42) et en ne gardant dans les équa- 
tions (41) que les termes du premier ordre en ôa et 66, on obtient 
les équations aux variations suivantes: 


d d R ES 
+ 6a+[aD(v, a) | 05e cos 0 8 — 0, | 
d 
7 60+ [2 V(v a)] ,6a+ er cos 06a+ | (9.43) 


+ ne sin 0*60 — 0. 


Les équations (43) sont des équations différentielles linéaires 
aux coefficients constants. En y remplaçant _. sin 0* et + cos 0° 


par leurs valeurs tirées de (42), on peut ramener les équations (43) 
à la forme 


Fôe+[+ aO (v, e)| _ Ga+[va*—a"Y (v, a*)]80—0, 


_. 00 + [5 Y (v, a) |. _ Ôa—-(v— Ÿ (v, a*)] 6a + (9.44) 
+ © (v, a*) 60 — 0. 
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L'équation caractéristique du système d'équations différentielles 
(44) est 
X + MA + M, = 0, (9.45) 


« 


ou 


Mi=O(v, a°)+ [+ aQ (v, a) |. ; (9.46) 
Ma=O(v, a*) EE aD(v, &)| 
—[va* — a*Y (v, a°)] [+ Fra) | +Iv— Y(v, 4%). (9.47) 


Les mouvements stationnaires considérés (c’est-à-dire les oscil- 
lations forcées) sont asymptotiquement stables si Ôa et 66, dé- 
terminées par les équations (44), tendent asymptotiquement vers 
zéro quand {—> oo. Ceci a lieu si les racines de (45) satisfont à la 
condition 


Re, < 0, Re À, € 0. (9.48) 


Quant à la condition (48), pour qu'elle ait lieu, il faut et il suffit 
de respecter les conditions 


M>0, M,>0. (9.49) 


Si au moins un des coefficients M, ou M, est négatif, le mouvement 
stationnaire considéré sera instable. 

L'observation de la condition M, >0 peut être vérifiée en 
calculant M, d’après la formule (46). 

Pour ce qui est de la condition M, > 0, on peut en juger direc- 
tement d’après la courbe de résonance. Il en est ainsi du fait que 
d'après (37) et (47) 


Me=() (9.50) 


ie | _- Le de : oW 
Ainsi le signe de M. coïncide avec celui de == en a = a*. Pour 


ce qui est du signe de Lu ,ilest déterminé suivant l'allure de la 


courbe de résonance, comme nous l'avons décrit précédemment. 
En particulier, il résulte de la relation (50) que tout point de l’arc 
situé au-dessus du point m de la branche gauche de la courbe de 
résonance (fig. 9.1) correspond aux oscillations forcées instables, 


parce qu’en n'importe lequel de ces points ou < (0. 


CHAPITRE 3 


SYSTÈMES À COMMANDE EN TEMPS FINI 


$ 10. Fonctions des matrices et leur application à l'intégration 
des systèmes d'équations différentielles linéaires 


L'application des fonctions des matrices à la théorie des sys- 
tèmes d'équations différentielles linéaires a fait l’objet des ouvrages 
fondamentaux de I. Lappo-Danilevski [50]. Ces problèmes ont 
également été étudiés avec force détails dans les monographies de 
F. Gantmacher [21] et B. Boulgakov [17]. Ce sont des ouvrages 
qui ont guidé l’auteur dans l’exposé qui suit. Les méthodes de la 
théorie des fonctions des matrices trouvent leur application directe 
dans les problèmes de commandabilité et d’observabilité étudiés 
ci-dessous. 

1. Théorème de Bezout généralisé. Soit À — [A,,] une matrice 
carrée nr X n. Désignons par F (À) = [F;, (M1 (nr X n) le polynôme 
matriciel de degré m 


FD = FA + FAI HE + Fr (FoÆ0). (10.1) 


Constatons que si dans l'expression (1) le scalaire À est remplacé 
par la matrice À, on a 


F(A)= FA" HF AMIE LH FnE, (10.2) 
F (A)= A"Fo+ AM Fi+ ... L EF (10.3) 
et de plus, dans le cas général, F (4) £Æ F (4). 


Divisons le polynôme matriciel F (À) par le binôme ÀE — À à 
droite et à gauche 


F()—QGRE—A)+R, F (à) = (RE — A)Q (à) + R. (10.4) 


Comme après la division des polynômes le degré du reste est infé- 


rieur à celui du diviseur, le reste droit R et le reste gauche À ne 
dépendent pas de À. 


En substituant dans les identités (4) la matrice À à À, opération 
possible du fait que la multiplication de la matrice À par les coeffi- 
cients matriciels du binôme ÀE — À étant commutative, on obtient 


F(4)=@(4XA—4A)+R, F(4) = (4 — À) Q (4) + À. (10.5) 


On en déduit le théorème suivant. 
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Théorème de Bezout généralisé. Si l’on divi- 
se à droite (à gauche) le polynôme matriciel F(À) par le binôme À E — À, 
le reste de la division est égal à F (A) (respectivement à F (A).). 

Corollaire. Le polynôme matriciel F (À) est divisible à 
droite (à gauche) sans reste par le binôme ÀE — À si et seulement si 
F (A) = 0 (respectivement F (A) = 0). 

2. Théorème de Cayley-Hamilton. Considérons la matrice 
A =1[4;;l(r X n). On appelle matrice caractéristique de À la 
matrice À£ — A. Le déterminant de la matrice caractéristique 


A (À) = det (LE — À) (10.6) 


est un polynôme scalaire en À dit polynôme caractéristique de la 
matrice À. Les racines de l'équation A (À) = 0 s'appellent valeurs 
propres ou nombres caractéristiques de À. 

Désignons par B;, (À) le cofacteur de l'élément ÀE,; — À,; 
du déterminant A (À). La matrice B (À) — [B;;,] (7 X n) est une 
matrice adjointe de la matrice ÀE — A. 

Les définitions précédentes conduisent aux identités suivantes 
par rapport à À: 


(ÂE — A)B(À) = AE, (10.7) 
B (à) (ÀE — À) = A (à) E. (10.8) 
Comme 
AG) = À + CAE HONTE +... +cnÀ + Cn, (10.9) 
il s'ensuit que 
AGE—=EX +(QE)1+...+(cE) A +GE (10.10) 


est un polynôme en À à coefficients matriciels. La matrice B (À) 
peut s’écrire également sous la forme d'un polynôme en À à coeffi- 
cients matriciels. 

Les égalités (7) et (8) montrent que À (À) E est divisible à droite 
et à gauche sans reste par ÀE — A. D'après le théorème de Bezout 
généralisé ceci n’est possible que si le reste À (A)E — A (4) est 
nul. On en tire le théorème suivant. 

Théorème de Cayley-Hamilton. Toute matrice 
carrée À satisfait à son équation caractéristique, c'est-à-dire 


A (4) = 0. (10.11) 


L. 


3. Polynôme minimal associé à une matrice. Le polynôme sca- 
Jaire f (À) s'appelle polynôme annulateur d'une matrice carrée À si 


jf (4) = 0. 
Le polynôme annulateur (4) de plus petit degré et dont le 


coefficient supérieur est l'unité s'appelle polynôme minimal asso- 
cié à la matrice À. 
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D'après le théorème de Cayley-Hamilton, le polynôme caracté- 
ristique À (À) de la matrice À est son polynôme annulateur. Toute- 
fois, dans le cas général, ce polynôme n’est pas minimal. 

On peut montrer qu’un polynôme annulateur arbitraire f (À) 
d'une matrice se divise sans reste par son polynôme minimal 1 (À). 
En effet, en divisant f (À) par 1 (À), on a 


f Q) = # Q) q À) + r (Q), (10.12) 


où le degré de r (À) est inférieur à celui de 1 (À). La relation (12} 
entraîne 


f (4) = + (4) q (4) + r (4). (10.13) 


Puisque f (4) = 0, 1# (4) = 0, on a également r (4) = 0. Mais 
le degré de r(À) est inférieur à celui du polynôme minimal 1 (À). Donc 
r (à) = 0, c’est-à-dire f (À) se divise sans reste par 1 (À). 

Soient % (À) et w, (À) des polynômes minimaux associés à la 
matrice À. Dans ce cas, ils se divisent l’un par l’autre sans reste, 
c'est-à-dire ces polynômes diffèrent par un coefficient constant. 
Les coefficients supérieurs de 1 (À) et de 1, (À) étant égaux à l'unité, 
Ÿ, (4) = Ÿ (À). Nous avons démontré ainsi l’unicité du polynôme 
minimal associé à la matrice À donnée. 

Désignons par D, _, (À) le plus grand commun diviseur de tous 
les mineurs d'ordre (7 — 1) d’une matrice caractéristique ÀE — À, 
c'est-à-dire le plus grand commun diviseur des éléments de la matri- 
ce adjointe B (à). De plus, réduisons à l'unité le coefficient affecté 
au degré supérieur en À du polynôme D, , (À). Appelons ce dernier 
diviseur déterminant d'ordre (7 — 1) de la matrice ÀE — A. Ce qui 
vient d’être dit amène 


s B (4) = Da (Q)C (à), (10.14) 


où C (À) est une matrice polynomiale dite matrice adjointe réduite 
de la matrice ÀE — À. 

En multipliant les premier et deuxième membres de la relation 
(14) à gauche par la matrice ÀE — À on a, d'après (7), 


A(DE=(XE — A)C (à) D, (À). (10.15) 


En développant le déterminant caractéristique À (À) par rapport 
aux éléments d’une ligne quelconque on obtient une somme des. 
termes dont chacun se divise sans reste par D, _, (À), et, donc, A (À) 
se divise sans reste par D,_, (À), c'est-à-dire 


A (à) 
Da-1 (à) 


— (à), (10.16) 


où 4 (À) est un polynôme. (Ce polynôme est le plus grand facteur 
invariant de la matrice caractéristique ÀE — À 
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Les expressions (15) et (16) amènent 
%d (À) E = (ÀE — À) C (à). (10.17) 


Remarquons que la multiplication à droite des deux membres 
de la relation (14) par la matrice ÀE — À donne d'après (8) 


AGE = D,., (À) C ()(AE — À), (10.18) 
d’où, conformément à (16), on a 
Ÿd (À) E = C'(M(AE — À), (10.19) 


c'est-à-dire C (À) est à la fois le quotient à gauche et le quotient 
à droite de la division de 1 (À) £ par ÀE — À. 

Ainsi le polynôme matriciel w (À) E se divise sans reste à gauche 
(et à droite) par la matrice ÀE — À. Par suite d’après le théorème 
de Bezout généralisé, 


Ÿ (4) £ = Ÿ (4) = 0, (10.20) 

et, par conséquent, Ÿ (À) est un polynôme annulateur de la matrice À. 

Montrons maintenant que # (4) est le polynôme minimal. Soit 

4* (À) le polynôme minimal de la matrice À. + (À) se divise alors 
sans reste par w* (À), c'est-à-dire 

Ÿ (À) = ## (À) 4 (À). (10.21) 


Puisque Ÿ* (4) = 0, en vertu du théorème de Bezout généralisé 
le polynôme matriciel 11* (À) Æ se divise à gauche sans reste par 
ÀE — À: 


Ÿ *(A) E = (AE — À) C® (à). (10.22) 


En multipliant les deux membres de la relation (22) par le polynô- 
me % (À), on obtient 


Ÿ (À) E — (ÀE — À) C® (À) x (À). (10.23) 
La comparaison des relations (23) et (17) conduit à 
C (À) = C® (à) x (À). (10.24) 


La relation (24) entraîne que % (À) est un commun diviseur de tous 
les éléments de la matrice polynomiale C (À). Mais, comme on le 
voit de (14), le plus grand commun diviseur de tous les éléments 
de la matrice C (À) est égal à un certain nombre constant du fait 
que la matrice C (À) a été obtenue en divisant la matrice B (À) par 
le plus grand commun diviseur D,., (À) de ses éléments. Ainsi, 
x (À) = u = const. Comme les coefficients dominants de ++ (À) 
et w* (À) sont égaux à l'unité, (21) conduit à u = 1, et donc 
x (À) = 1. Ainsi, (À) = 4% (À), c’est-à-dire 1 (À) est un polynôme 
minimal de la matrice À. 
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De cette façon, d'après (16) ‘le polynôme minimal de la matrice 
A est déterminé par la formule 


__4() 
Ÿ (À) — D: (10.25) 
Considérons maintenant la formule (17): 
4 (À) E = (ÀE — À) C (à). 
Le déterminant du produit de deux matrices étant égal au produit 
de leurs déterminants, et det [1 (À) E] = [+ (À)]", on a 
[p (À)}" = À (à) det C (à). (10.26) 
Il s'ensuit que [+ (À)]" se divise sans reste par À (À), et en vertu 
de (25), À (à) se divise sans reste par % (À); par suite, les zéros du 
polynôme 1 (À) coïncident avec les zéros du polynôme A (À), bien 
que dans le cas général les ordres de multiplicité de ces zéros dif- 
fèrent pour 4 (À) et À (À). Par conséquent, toutes les valeurs propres 
différentes entre elles de la matrice À sont les zéros du polynôme mini- 
mal *p (À). 
On en tire que si 


A (À) = (À — A) (À — A)... (À — A,)rs, (10.27) 
tr +...+nr =n, (10.28) 

le polynôme minimal w (4) est de la forme 
PO) = GA — AM) — A)... (4 — A), (10.29) 


où 


avec 
1m LS (k =1,2,...,s). (10.30) 
Le degré m du polynôme minimal # (4) est 
Mm=MmÉEmMmt#t...+ms. (10.31) 


Les binômes (À — À4)"# (k — 1, ..., s) sont les plus grands divi- 
seurs élémentaires de la matrice ÀE — À. 

&. Fonctions des matrices. Soit Ia matrice carrée À — 
—(4;,l(n Xn) et la fonction f (À) de la variable scalaire À. Déterminer 
ce qu'il faut entendre par f (A), c'est-à-dire étendre également la 
fonction f (À) aux valeurs matricielles de la variable. 

Dans ce qui précède (29) nous avons désigné par % (À) le polynô- 
me minimal de la matrice À: 


PA) = AMG A)". (AA 
(mit mt... +m=m). 
Soient deux polynômes g (à) et À (À) tels que 
£g (A) = h (4). (10.32) 


10—0393 
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La relation (32) entraîne que la différence de ces deux polynômes 
d(A) =£g(X) — h (à) (10.33) 


est an polynôme annulateur de la matrice À et, par conséquent, 
cette différence se divise sans reste par le polynôme minimal w+ (à), 
c’est-à-dire 


ee ET 5 (1). (10.34) 
où S (À) est un polynôme en À. Ainsi 
gO =RkA) + S (4) 1 (Q). (10.35) 
La relation (35) s'écrit 
g(A) =hA(A) (mod y (à)) (10.36) 


ce qui se lit: la relation g (À) est congrue à hk (À) modulo w# (à), 
La relation (34) entraîne que 


d (à) = + (Q)S (à), (10.37) 
c’est pourquoi, en vertu de (29), on a 
d(M)=0, d'(1)=0,..., dm 0 ()=O (k=1,...,s) (10.33) 
ou d’après (33) 
g(x)=h (hu), g'(x)=h" (M), 
ER Qu)= ART OO) (k=1....,s). (10.39) 


Ici À, (k = 1, ..., s) sont les zéros du polynôme minimal + (À). 
Soit maintenant une certaine fonction f (À). Les nombres 


Qu), fu), 2, FR (Qu) 
(k=1,...,s; mik+mi+...+ms=m) (10.410) 


s'appellent valeurs de la fonction f (À) dans le spectre de la matrice À. 
Désignons l’ensemble de ces valeurs par le symbole f (A1). 

Si pour la fonction f (À) les valeurs (40) existent, c'est-à-dire 
si elles ont un sens, on dit que la fonction f (À) est définie dans le 
spectre de la matrice À. 

Il s’ensuit de la formule (39) que dans le spectre de la matrice 
A les polynômes g (À) et hk (À) ont les mêmes valeurs, c'est-à-dire 


g (Aa) = h (Au). (10.41) 


Pour les polynômes g (à) et k (À) la réciproque est également vraie. 
Si les relations (39) sont données, on en déduit la relation (36) qui 
implique que g (4) = R (4). 
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Ainsi, les valeurs du polynôme g (À) dans le spectre de la matrice 
A déterminent complètement la matrice g (A), c'est-à-dire tous 
les polynômes g (à) qui dans le spectre de la matrice À prennent les 
mêmes valeurs ont la mème valeur matricielle g (4). 

Dans le cas général, la définition de la fonction f (A) est soumise 
à la même restriction: les valeurs de la fonction f (4) dans le spectre 
de la matrice À doivent définir complètement f (4), c’est-à-dire 
toutes les fonctions f (À) prenant les mêmes valeurs dans le spectre 
de À doivent avoir la même valeur matricielle f (4). 

Il en résulte que pour déterminer f (4), il suffit dans le cas 
général de trouver un polynôme g (À) tel qu'il prenne les mêmes 
valeurs dans le spectre de la matrice À que la fonction j (À) et de 
poser f (4) = g (4). 

On aboutit ainsi à la définition suivante. 

Définition 1. Si la fonction f(À) est définie dans le 
spectre de la matrice A,on a 


f (4) = &g (4), (10.42) 


où g (À) est un polynôme quelconque qui prend dans le spectre de A 
les mêmes valeurs que f (À): 


J (Na) = & (Aa). (10.43) 

On sait [17, 21] que de tous les polynômes à coefficients com- 
plexes qui prennent les mêmes valeurs dans le spectre de À que la 
fonction f (À) il y a un polynôme r (À) et un seul de degré inférieur 
ou égal à m — 1. Ce polynôme s’appelle polynôme d'interpolation 
de Lagrange-Sylvester de la fonction f (À) dans le spectre de la matrice 
A. Il est défini univoquement par les conditions d’interpolation 


r(u)=f(u), r'Au)=f Qu). rm Qu)= fou) (10.44) 
(k=1,2,...,s; m+mat... mm). 


La définition 1 peut ètre maintenant énoncée sous la forme 
suivante. 

Définition 1’. Soit f(À) une fonction définie dans le 
spectre de la matrice A, et r (À), son polynôme d’interpolation de La- 
grange-Sylvester défini par les conditions d'interpolation (44). Il vient 


f (4) = r (4). (10.45) 


9. Polynôme d'interpolation de Lagrange-Sylvester. Le poly- 
nôme d'interpolation de Lagrange-Sylvester r (À) vérifiant les 
conditiors (44) 


r(M)= fu), r'(u)=f' Ou), FORD) = fra 0 (Au) 
k=1,2,...,s; mitmat...+m=m), 
| 10% 
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où d’après (29), À4 (4 = 1, . .., s) sont les zéros du polynôme mini- 
mal 1 (À) de la matrice À: 
YA)=A—-M)T (AA)... (AA) (mitmt ... +m=m), 


est de la forme 
s MR i 


CRETE p (Q) 
LU 2 2 (RE à ere hs or 
(10.46) 
ou 
pa (= 10, (10.47) 


(A —A)"* 
Comme il résulte de (46) et (29), le degré du polynôme r (à) est 
inférieur ou égal à m —îi 
Si tous les zéros du polynôme minimal w (4) sont simples 
Mm=M=... =M, = À, 


*“ 


conformément à (26) le polynôme d'interpolation r (À) devient 


_Q fn vQ 
= 3 Jon Lo. (10.48) 


La formule (48) est la formule d'interpolation de Lagrange bien 
connue qui, comme on le voit aisément, respecte les conditions 
rQu) =f() (B=1,..., 5). 

On vérifie également sans peine que ce polynôme, défini dans 
le cas général par l'expression (46), satisfait aux conditions d’inter- 
polation (44). A cet effet, en vertu de (47), il est plus commode de 
récrire (46) comme suit: 


8 Mp— | 


r (À) = 2 2 = na —p— 1 À 


RkR=1 p= 
g"h P- 1 f (à) m,—p-1 
X [ser 5 Lana, (eh) pr (A) (10.49) 


ou 


NI L0 à f() 
r (A) = 2 (Cas ha, + Lex ve 07 Jana, OH) + 


1 pm 4 _f({) 
+ nu pe Ps à 


1 MR fn) my _ 
+ mx 1) ns re k=A (À — À») } Ÿk (À). (10.50) 
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Ainsi, par exemple, on trouve d'après (50) que 


(2 Jen, = (Cr dan, 96 0) + Coran D 0} 


du fait que les autres termes qui apparaïtront au cours de la déri- 
vation de (49) s’annulent avec À = À,. D'où 


CONTE RTE 


f' Q) bu À) —f A) pi À) . 
+ Thu UE L. Pu @},, = (Au) 


ce qui correspond aux conditions (44). D'une façon analogue, on 
peut justifier les autres conditions (44). 

Pour démontrer l’unicité du polynôme de Lagrange-Sylvester, 
on peut procéder de la façon suivante. 

Soit f (À) la fonction scalaire analytique d’une variable complexe 
À, régulière dans un domaine qui comprend tous les points À,, zéros 
du polynôme %# (À) déterminé par l'expression (29) 


p(A)= (AA) (A a) (AA) (mitmat ... ms = m). 
Dans le domaine considéré, la fonction ee ne possède pas 
des points singuliers autres que les pôles, et peut s’écrire 


HO) : 
TI RO TG (TE x): (10.51) 


Ici À (À) est une fonction régulière dans le domaine considéré : 

Gx (A/ÀA — À»), la partie principale du développement de la fonction 

f (Q@)/w (À) en série de Laurent au voisinage du point À — À4. La 

fonction G, (1/À — À:) peut se mettre sous la forme suivante: 
mp1 


1 : Hh+p 


Si l’on porte cette expression dans (51) et multiplie la relation 
obtenue par (À —2À,)"*, on obtient 


s MR! 
= ROA-AÈE D D Has) 7, (10.53) 
R=1 p=0 


où x (À) est déterminée par l'expression (47). Comme la fonction 
R (A)(A — À4)"* est régulière au voisinage du point À, et s'annule 
en ce point avec les dérivées jusqu’à l’ordre (nm, — 1), on trouve 
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à partir de (53) que 
du 


TA T (10.54) 


di à “Re TlTen pa À) Ja=a, 


Ainsi, l'expression (53) se met sous la forme 


LA) LP). 
Fo = AG)+ 


s mp, — À g"h= sr 


+Q)_ 1 : 
in À 2 = map Per : Ÿr (À) mo barre. (10.55) 


La relation (55) entraîne 
f Q) = RQ) ÿ À) + r (Q), (10.56) 


où r (à) est le polynôme déterminé par l'expression (46). Puisque 
les fonctions À (À) et 1 (4) sont régulières dans le domaine consi- 
déré, et en À = À, (k = 1, ..., s) 5 (À) s'annule avec les dérivées 
d'ordre égal ou inférieur à (mx — 1), r (À) constitue précisément 
le polynôme qui satisfait aux conditions d’interpolation (44). 

Notons que si À est une matrice dont les éléments sont des nom- 
bres réels, son polynôme minimal w# (À), comme on le voit d’après 
la relation (25), est également à coefficients réels. C'est pourquoi 
les zéros de 1p (À) sont des nombres réels complexes conjugués deux 
à deux. 

La fonction jf (À) est dite réelle dans le spectre de la matrice A si 
pour une valeur propre réelle À; toutes ses valeurs dans le spectre 
f (M), f' Gi), . . . sont réelles et pour deux valeurs propres complexes 
conjuguées À, et À, = À, les valeurs associées dans le spectre sont 
également complexes conjuguées: f (A4) = f (A1), f' (Ag) = f" (An), . 
Dans ce cas, les coefficients du polynôme d'’interpolation r (À) sont 
réels, et la matrice r (À) et, par suite, f (4) = r (A), est une matrice 
à éléments réels. 

6. Construction de la fonction et. D'après (45), la fonction 
et s'écrit 


eAt — r (A), (10.57) 


où r (À) est le polynôme d'interpolation correspondant déterminé 
par l'expression (46). D'après (46), la formule (57) peut se mettre 
sous la forme 

m—i 


eAt— 2 Œh (4) A*, (10.58) 


où m est le degré du polynôme minimal de la matrice À. 
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Supposons que la matrice À soit de la forme 
1 1 0 
A=| 0 1 O |. (10.59) 
0 0 2 


La matrice caractéristique ÀE — À est alors 
TÀA—1 --1 0 
ÂE—A— O0 A1—1 O0 | 
(0) O0 ÀA—2 
Le déterminant de la matrice caractéristique vaut 
A(A)=(À—1)2 (À —2). 
La matrice adjointe s'écrit 


| (A— 1) (À —2) 1 —2 0 — 
B(À)=adj(iE — A)= (9 (À — 1) )A —2) 0 
0 0 (à —1)2 
Le plus grand commun diviseur des éléments de la matrice adjointe 
Do (à) =1. 
D'après (25), le polynôme minimal de la matrice À est 
A (À) e 
= 1 (à —2). (10.60) 


En vertu de (40), on a les valeurs suivantes de la fonction f (À) et dans le 
spectre de la matrice À 


(As) = (eh i=et, f' (M) = (% a) RES 


fe) =(eM)1ee = et. 
Selon (44), les conditions d’interpolation s'écrivent 


r (A) =et, (= r (Âe)= et, 


avec 
A1=1, À =2. 
Puisque, d’après (47), pour la matrice À considérée 


> +0 
1 (4) = (À —1)° — À — 9, 


ve =D 17, 


d’après (50) le polynôme d’interpolation de Lagrange-Sylvester sera 


ne () 6-2 (Es) 0-0 0-2 + 


Li Cr G— 1 
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ou 
r(A)=—et(À—2)+(—tet—et) (12—31 +2) Het (A2— 21 +1). 
Cette expression peut s’écrire de la façon suivante: 
r (A) = ao (#) +4 (t) À + me (1) A2, (10.61) 

avec 

œo(t)=—2tet +et, 

œ (t)—=3tet+ 2et— 2e, 

Go (t)= —tet—el Let. 


Par conséquent, pour la matrice À considérée (59) et compte tenu du fait que 
A0=E (où E est la matrice unité), on a 


eÂt = ao (t) E+ a (t) A+ ae (t) A1. (10.62) 
Montrons maintenant que les fonctions @x (£) (k = 0, 1, ..., 
m — 1) qui interviennent dans l'expression (58) sont linéairement 


indépendantes. Considérons d’abord le cas où toutes les valeurs propres 
de la matrice À sont simples. La formule (58) s'écrit alors 


n— 1 
= à ax (t) A*. (10.63) 


Dans ce cas, d'après (44), les conditions d'’interpolation de la 
fonction f (À) = e définie dans le spectre de la matrice À sont 
À t 
r(b)= (A9) =e ? (p=—1,...,n). 
Comme d'après (45) la fonction d’une matrice est par définition 
f(4)=eft=r (4), 


on obtient, compte tenu de (63), le système d'équations scalaires 


DETTES (p=1, ...,n) 
ou 
Go (£) + AG (6) + Aa (£) +... HAT lan (t) = ht, 
Go (£) + Az (£) + Mie (4) +... +27 ans (é) = ent, 


Co (€) + An (£) + EC (&)+... HART lan (t) = eAnt. 
En désignant par M, «a (t) et R (t) les matrices 


LA Les AE &o (4) ext 
3 n—1 Act 
mlthh ME coe “4 0 , Rb=|lT |, 


An À ... Ag Œn  (£) ent 
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on a l'équation vectorielle suivante 
Ma (t) = R (t). 


Les éléments du vecteur R (t) sont des fonctions linéairement indé- 
pendantes. Le déterminant de la matrice M est un déterminant de 
Vandermonde et donc det M =£ 0. C’est pourquoi il existe une matri- 
ce inverse M”! et, par suite, 


a (t) = MR (t). 


Puisque MM”! = E, det M”! — _ Æ 0, c'est-à-dire les lignes 


de la matrice M”! sont linéairement indépendantes. C’est pourquoi 
les éléments du vecteur «&(t), c'est-à-dire les fonctions «, (t), 
œ x(t), . .., Œn-1 (t) sont linéairement indépendantes. 

Une démonstration analogue peut être appliquée au cas où parmi 
les valeurs propres de la matrice À il y a des valeurs multiples. 


Revenons maintenant à notre exemple. Puisque 


120 
010 |, 
_004 


en vertu de (62) la matrice et est de la forme 


ttet 0 
DE et 0 : (10.64) 
0 O eït 


A= 


Remarquons encore que pour la matrice (59) l'expression (61) du poly- 
nôme d’interpolation r(A) peut s'écrire 


r (À) = tps (À) + tetqpre (À) + e2{pes (À) (10.65) 
avec 
Pas (A)= — A+ 2A, pe (A) = — A+ 31 —2, 
pui (A) = A2 22 +1. } 19:68) 
De plus, selon (57) la matrice et peut se mettre sous la forme 
At etZis + tetZiate2iZos, (10.67) 
où 
Zxj = Pay (A). (10.68) 


On voit aisément que si au lieu de ext on prend une autre fonction f Qi 
alors, conformément à la définition (45) de la fonction d'une matrice, dans le 
cas de la matrice À déterminée d'après (59) la fonction f (A) peut s'écrire 

1 (4) = f On) Zin + S° (M) Zi + f (As) Zone (10.69) 
Ici, = 1, À2 = 2 sont les zéros du polynôme minimal 1 (à) défini par l'expres- 
sion (60) et dont les ordres de multiplicité sont respectivement m, = 2, ma = 1. 


7. Composantes de la matrice À. Si dans l'expression (49) du 
polynôme d’interpolation de Lagrange-Sylvester r (À) on réunit les 
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termes de même valeur de la fonction f (À) ou d’une quelconque de 
ses dérivées, le polynôme r (À) devient 


r (A) = à (f (An) qas (À) + f' (x) Pas (À) + + 2 + PR (An) Pam, (À). 
(40.70) 


Ici qu (NW (k =1,...,s; j —1,..., m,) sont les polynômes 
en À à coefficients constants; le degré de ces polynômes est inférieur 
ou égal à m — 1, où m est le degré du polynôme minimal wŸ (à) 
de la matrice À. 

En vertu de (70) on obtient de la formule (45) l'expression suivan- 
te de la fonction f (4): 


f(4)= 2 Lf (An) Zu + F (ua) Zaa + eee HN (An) Zamylr (10.74) 


où 
Znj=Qu(À) (=, ...,s; j=1,..., mi). (10.72) 


Les matrices Z,; ne dépendent pas du choix de la fonction f (à), 
elles ne sont déterminées que par la forme de la matrice À. Les 
valeurs de la fonction f (À) dans le spectre de la matrice À intervien- 
nent dans le second membre de l'expression (71). Les matrices 
Zn (k =1,...,s; j —=1,..., m,;) s'appellent composantes de 
la matrice À. 

On peut montrer que les composantes Z,;, de la matrice À sont 
linéairement indépendantes. En effet, supposons que 


s M s M} 

TS KI 
à à Chj£n = 2 à ChjPaj (À) = 0. (10.73) 

— Jt-= = = 


Déterminons le polynôme d'’interpolation r (À) à partir de m condi- 
tions 


FD (y) = Cu (k=1, 53 j=1, ..., Ma). (10.74) 
D'après (70) on a 
s My 


r (à) — 2 à ChjPx; (À). (10.75) 


Les expressions (75) et (73) entraînent que 
r (4) = 0. (10.76) 


Comme le degré du polynôme r (À), déterminé par la formule (75), 
est inférieur à celui du polynôme minimal 1 (4), la relation (76) 
conduit à 


r()= 0. (10.77) 
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L'identité (77) et les relations (74) amènent 
Chj = (& =1,...,s; j—=1,..., mx). (10.78) 


Ainsi la relation (73) ne peut avoir lieu que si les conditions (78) 
sont observées et, par conséquent, les matrices Z;,; linéairement 
indépendantes. | 

D'une façon analogue on peut montrer qu'aucune des matrices 
Zn; n’est nulle. En effet, si l’une quelconque des matrices Z,; était 
nulle, le fait que le degré du polynôme associé w;; (À) est inférieur 
au degré m du polynôme minimal donnerait lieu à l'identité 


Pas À) = 0. (10.79) 


Or, ceci est impossible parce que ®;; (À) est un polynôme d’interpo- 
lation de Lagrange-Sylvester d’une fonction dont toutes les valeurs 
dans le spectre de la matrice À sont nulles, sauf fÜ-1) (,) égale 
à l'unité. 

Constatons que dans l’exemple examiné au point G les fonctions 
x; (À) sont définies par les expressions (66). 

8. Formules générales des composantes Z,; de la matrice 4. 
Nous avons dit ci-dessus que les matrices Z,; ne sont déterminées 
que par la forme de la matrice À et ne dépendent pas du choix de la 
fonction f (À). Indiquons maintenant les formules générales qui 
définissent les matrices Z,;. 

Considérons la fonction 

n | 
fH=— (10.80) 
où À est un paramètre. On déduit de (80) que 
ro) 1 0? 2! 8 s! 
EU nl ME À ae =; ...) mes: Fes 


(10.81) 


D'après (80), f (H)(A — pu) = 1. Comme ju) et r(u), où r (y) 
est le polynôme d’interpolation de Lagrange-Sylvester, coïncident 
dans le spectre de la matrice À, dans ce même spectre 


r (U)(A — u) = 1. (10.82) 


En remplaçant dans l’expression (82) l'argument scalaire up par 
la matrice À on obtient la relation matricielle: 


r (AJAE — A) = E, (10.83) 


r (4) = (LE — A) 1. (10.84) 


En vertu de la relation (45) on en déduit que la fonction f (u), donnée 
par l'expression (80), correspond à 


f(A4) = (GE — A). (10.85) 


d’où l'on tire 


456 SYSTÈMES À COMMANDE EN TEMPS FINI (CH. 3 


Les expressions (70), (80) et (81) montrent que le polynôme 
r (u), déterminé par les valeurs f (u) dans le spectre de À, est le 
suivant 


_ © out), quel) : 21que(u) (mp —1) ! Qm, (4) 
(= > | ue + Pet AE ae D — | 
Ca (à — Az) 
(40.86) 


D'où, en remplaçant la variable scalaire par la matrice À, on 
obtient 


(zZ Zi 21Z (mr —1) lZym 
ja D + + + | 
hk=1! (À —Àx) 
(10.87) 
D'après (85), (8) et (19) 
HA =UE-Ay12=20- 00. (10.88) 


AG pQ) 


Ici B (à) est la matrice adjointe de la matrice ÀE — À; A (à), le 

déterminant de la matrice ÀE — À. La matrice C (à) s'appelle 

matrice adjointe réduite, elle est déterminée par l'expression (14); 

4 (À) est le polynôme minimal de À, défini par l'expression (16). 
La relation (87) peut maintenant se mettre sous la forme: 


4 _ CO) 
QE—ayt= 0 = 
= S [Zn Zne 21Zrs (mn 1) Zum, 
= > Et Re + me ee |. (40.89) 


Puisque d'après (29) 
p (Q) = (à — A) — 2)... (À — 1)" 
(m+mMm+...+m, = m), 
l'expression (89) est la décomposition de la fraction rationnelle 
LS en une somme de fractions élémentaires, les coefficients de 
cette décomposition étant les matrices 
G — 1)! Ze) At, 1:85 1—=4,.:35:; mi). 


En comparant les expressions (89) et (55), on trouve que les matrices 
Zx; sont de la forme 


D. 1 dx TT CA 
AT — (j—1) | (mn —j) | | aA TR? Ÿe (À) 1. (10.90) 


(k= 1, 8, j=1, ses M) 
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9. Représentation des fonctions des matrices par des séries. 
Adressons-nous de nouveau à la matrice À dont le polynôme 
minimal 1 (À) est de la forme (29) 


VA)= (AA) NA)... (A—)"s (m+m+...+<m=m), 


et supposons que la fonction f{À) et la suite des fonctions 
f (À), ..., fp (À), . . . soient définies dans le spectre de la matrice À. 
Définition 1. S’il existe des limites 


limf,(u), limfs(u), ..., limfo Qu)  (k=1,...,5), 
P—o P— © pP—o 


la suite des fonctions f, (À) tend avec p — œ vers une certaine limite 
dans le spectre de la matrice À. 

Définition 2. La suite des fonctions fh (À) tend avec 
p —+ © vers la fonction f (À) dans le spectre de la matrice À, ce 
qui s'écril: 


lim fp (A4) = f (Aa), (10.91) 
si 
Jim fp (a) = f (Au), lim fa) = f (M), 


(m1) 


...,limf, Qu)= fa Qu) (k=1,...,5s). (10.92) 
p— 00 


La formule (71) 
f(4)= DU On) Zas + S' (ha) Zae + 22e PUR (ui) Zum] 


exprime la fonction f (À) au moyen des valeurs de f (À) dans le 
spectre de la matrice À. Si l’on considère la matrice comme un 
vecteur dans l'espace R"* de dimension n#*, on tire de (71), en 
vertu de l'indépendance linéaire des matrices Z,;, que toutes les 
f (A) (pour À donnée) forment un sous-espace de dimension m de 
R"* ayant pour base les matrices Z,, (k—=1,...,s;j — 1, ..., my; 
M + Ma+...+m, = m). Dans cette base, les coordonnées du 
« vecteur » f (A) sont données par m valeurs de la fonction f (À) 
dans le spectre de la matrice À. 

Cette interprétation géométrique rend plus facile la démonstra- 
tion des théorèmes qui suivent. 

Théorème 1. Pour que la suite des matrices f, (A) soit 
convergente pour p —+ oo, il faut et il suffit que la suite f, (À) soit 
convergente pour p —+ © dans le spectre de la matrice À, c'est-à-dire 
que les limites lim f, (A), lim f, (A1) existent toujours simultanément. 

Pc P—0 
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Dans ce cas l'égalité 


lim fn (A4) = (A4) (10.93) 
entraine l'égalité 
lim fp (4)= f (4) (10.94) 
P— 00 


el inversement. | 
Démonstration. Si la suite f, (à) est convergente 
pour p —> oo dans le spectre de la matrice À, la formule 
(m,-1) 


fr 4)= S Dép (x) Zaa + fo (x) Zur + 4 + fr (nt) Zam,] (10.95) 


entraîne l’existence de la limite lim f, (A). Les formules (95) et (71) 


P— 00 

permettent de conclure que si la relation (93) a lieu, la relation 
(94) est également vraie. 

Passons à la démonstration de la réciproque. Supposons qu'il 
existe une lim f, (4) et que le type de la matrice f, (4) est n X n, 

D 00 

c'est-à-dire qu'elle possède n° éléments; de plus, n = m, puisque 
m est le degré du polynôme minimal de la matrice À. La relation 
matricielle (95) est équivalente à n° relations scalaires. Choisissens-en 
m relations que nous allons considérer comme un système de m 
équations algébriques linéaires par rapport aux inconnues 


" ; (m,—1) 
fn (An); fp(An)s oc. fn (A) 
(k=1,...,s; m+km+...+m=m). 
Les matrices Z;, étant linéairement indépendantes, parmi les n° 
relations il y aura m relations telles dont le déterminant composé 
de coefficients affectés à fp (An), f» (An), + - ., f9"R7 1) (Ay) sera non 


nul. Ainsi, les valeurs f, (Az), fn (An),..., fa" Qu) (k=1, ...,s) 
peuvent être exprimées à l’aide des formes linéaires de m éléments 
de la matrice f, (4). Il en résulte l'existence de la limite lim f, (A4) 


et par suite, si la relation (94) a lieu, la relation (93) est également 
vérifiée. 

Il ressort du théorème démontré que si la suite des polynômes 
£p (à) (p = 1, 2, ...) tend vers la fonction j (À) dans le spectre 


de la matrice À, 
Je £r (A)= f (A). 
Définition 3. La série à u, (À) converge dans le spectre 
p=0 
de la matrice À vers la fonction f (À), ce qui se note 


f(A4)= À un (Aa), (10.96) 
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si toutes les fonctions qui figurent ici sont définies dans le spectre de la 
matrice À et donnent lieu aux co 


jOu)= À Up (Au); f: (u)= à _ up (An), .. fn Qu) = 


OO 


= Sue Du) (=...) 


— 
— 


les seconds membres de ces égalités étant constitués de séries convergentes. 
Si l’on introduit les notations 


p 
s,(Ü)= u, (4) (p=0, 1,2, ...), (10.97) 
q=0 
la relation (96) peut s’écrire 
f(Aa)=lims, (A). (10.98) 
P— 00 


Maintenant on peut donner au théorème 1, démontré dans ce 
qui précède, une autre formulation équivalente. 
[se] 


Théorème 1’. Pour que la série Ÿ,) u,(A) converge 
p=0 


vers une certaine matrice, il faut et il suffit que la série à u, (à) 
p=0 
converge dans le spectre de la matrice A. L'égalité 


f(\a)= > Up (AA) 
p=0 


entraine alors l'égalité 


f(4)= © un (4) 


et inversement. 
Considérons maintenant une série entière à cercle de convergence 
[A— A |<R et à somme f (À) 


J@=T an(à— ho)  (lA—Aol< R). (10.99) 


Comme une série entière est dérivable terme à terme n'importe 
quel nombre de fois à l’intérieur du cercle de convergence, la série 
(99) converge dans le spectre de n ‘importe quelle matrice dont Îles 

valeurs propres se situent à l’intérieur de ce cercle. On en déduit le 
théorème suivant. 
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Théorème 2. Si la fonction f(À) se développe en une 
série entière dans le cercle|À—Àol< R: 


[= Ÿ à ho)? (10.100) 
p= 


ce développement garde son sens si la variable scalaire À est rempla- 
cée par une matrice À quelconque dont les valeurs propres reposent 
à l’intérieur du cercle de convergence. 

Ce théoreme entraîne, par Le. les développements suivants : 


az 9 # (1 4 
= À NÉ cos À — 2 Cp) | 74 
: A°P+1 
sin À = S 1 nr: (10.101) 
p=0 


AP+! 


co A2P 
su CHR LE Zen UESUR 


(E—A)'= À 4? (An <1;k=1,...,s). (10.102) 
p= 


Les développements (101) ont lieu pour toute matrice À du fait 
que les développements des fonctions correspondantes par rapport 
à la variable scalaire À ont lieu pour | À | << co. 

10. Extension de la formule intégrale de Cauchy pour les fonctions 
analytiques aux fonctions des matrices. Considérons dans le plan 
de la variable complexe À le domaine limité par le contour fermé 
et contenant les valeurs propres À,,..., À, de la matrice À. Soit 
f (à) la fonction analytique arbitraire régulière dans ce domaine 
y compris la frontière ]J'. _—. les formules de Cauchy 


1 À , f (À My — 

JO) pu [RO Ou) [Rd + 0 Qu 

caput( re à (k=1,...,s). (10.103) 

GA —h) À 

En multipliant les A membres de la relation matricielle (89) 
par —— Lo et en intégrant le long du contour fermé l, on obtient 
1 = 
mt AE —A)Y'f()dr=— 


= D LG) Zas + f Qu) Zaot ee HU (An) Zam, le (40.104) 


R=1 
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En tenant compte de la formule (71), la relation (104) se met 
sous la forme 


f(A)= 


LTAE- Aro. (40.105) 
r 


La formule (105) peut être adoptée comme définition de la fonc- 
tion analytique d'une matrice. 

11. Certaines propriétés des fonctions des matrices. 

Théorème 1. Soient G(u,, u,, ..., ur) le polynôme en 


Us Ua + es Uy3 fa (À), fe (À), « - ., fa (À), Les fonctions de À définies 
dans le spectre de la matrice À et 


g (À) = GT Q), fa À), - -., fr WI. (10.106) 
Alors, si dans le spectre de A la fonction g (À) s'annule 
g (A4) = 0, (10.107) 


on a la relation suivante: 
G [f1 (A), fe (A), . .., fa (4)] = 0. (10.108) 


Démonstration. Désignons parr, (4), re (4), ..., r (à) 
les polynômes d'interpolation de Lagrange-Sylvester pour f, (À), 
fe (À), ..., fa (à) et supposons que 


h (A) = Gr, (À), re (à), . .., ra ()]. (10.109) 


Puisque dans le spectre de la matrice À les valeurs de g (À) et k (à) 
coïncident, la relation (107) entraîne que 


h (A1) = 0. (10.110) 
Mais alors la formule (71) conduit à 
h (4) = 0 (10.111) 


ou 


Gr (4);re (4), T1] (4)1=G [1 (4), Î2 (A), EL | fi (A)1=0, (10.112) 


ce qu'il fallait démontrer. 


Examinons à titre de corollaire du théorème 1 les exemples 
suivants. 


1°. Soit 
G(u,, ue) = ui + ui — 1, 
f1 GQ) = sin À, fa (à) = cos À. 


g (À) = G [f1 (À), fa Q)] = sin? À + cos’ À — 1. 


Etant donné que le spectre de toute matrice À donne lieu pour la 
fonction considérée à la relation, 


g (A4) = 0 


Il vient 


11—0393 
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on a, d’après (112), 
G [f1 (4), fo (4)] = sin° À + cos À — E = 0 


ou 
sin® À + cos À = E. (10.113) 
2°. Soit 
G(u,, Us) = Ua — À, 
(A) = e, fa) = eÀ. 
Il vient 


g (À) = G [fi (À), fe QI = ehe7x — 1. 
Dans le spectre de toute matrice À on a pour la fonction considérée 
g Q) 
g (A4) = 0. 
C'est pourquoi, en vertu de (112), 
G[f1(4), f2(4)]=efe-A —E = 0 


ou 
eAe-A=E. (10.114) 


Il ressort de la relation (114) que la matrice inverse (e4)-1 est 


de la forme 
(eA)-! = e”A, (10.115) 


3°. Soit 
G (Us Uz, Us) = Uilo — Us; 
fU)= et, fo()=ete, fs(A)= entire, 
Alors, 


£ (À) = G{f1 (À), fe (à), fa (À)1 = ehfieMt2 — eMti+t2), 


Dans le spectre de toute matrice À on a pour la fonction considé- 
rée g (À) la relation 
g (A4) = 0. 


D'après (112) on en tire 
eAtieAt2z— eAltitt2) —( 


ou 
eAtieAt2 — pA(titi2), (10.116) 
4°. Soit 
G(uy, Us, Us) = Uy + la — Uy, 
fi (A) =cosÀ, f.(A) =sinA, fa(À) = ei. 
Il vient 


g (À) = Glfi (À), fe (À), fs (I= cos À + à sin À — eï. 
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Dans le spectre de toute matrice À on a pour la fonction g (À) la 


relation 
g (Aa) = 0. 
Il en résulte d’après (112) 


cos À + i sin À — eïiA — 0 
ou 
eiA — cos À —+ i sin À. (10.117) 


Ainsi le théorème 1 donne les conditions (107) sous lesquelles 
les identités associant les fonctions de la variable scalaire À peuvent 
être étendues aux valeurs matricielles de la variable. 

Le théorème 1 peut être renforcé pour démontrer le théorème 
suivant ([21], p. 121). 

Théorème 2. Soit 


gQ) = GT Q), fe À), ..., fr QI, 


où les fonctions f1 (À), fa(À), + « ., f1(À) sont définies dans le spectre 
de la matrice À, alors que la fonction G (u,, u,, . .., u,) résulte de 
l'application successive aux variables u,, u., . .., u, des opérations 
d'addition, de multiplication, de multiplication par un nombre et de 
la substitution de la valeur variable par une fonction arbitraire de celle- 
ci. Alors, si dans le spectre de À la fonction g (À) s’annule 


£g (A1) = 0, 
on a la relation suivante: 
G [f, (4), Îe (4), ...s fi (4)] = (0. 


12. Intégration des systèmes d'équations différentielles linéaires 
à coefficients constants à l’aide des fonctions des matrices. Cherchons 
la solution du système d'équations différentielles linéaires 


Fi = S'Ajntn  (G=i,...,n) (10.118) 
R=1 
sous les conditions initiales 
z; = Zj (0) G=1,...,nr) pour t = 0. (10.119) 


Ici A;r G, k = 1, ..., n) sont des constantes, en général complexes. 
Introduisons les matrices 


Ai: .. Ain Ti E 
Ales ù less (10.120) 
Ani …. Ann _ Tn 


La dérivation (intégration) des matrices consistant à dériver (inté- 
grer) chacun de leurs éléments, le système d'équations différentielles 


11% 
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scalaires (118) peut être remplacé par une équation différentielle 
vectorielle 


z = At. (10.124) 


Les conditions initiales (119) peuvent s’écrire 
z—=zxz(0) pour 1 = 0. (10.122) 


Mettons le vecteur cherché x (t) sous la forme d’une série de Mac- 
Laurin par rapport aux puissances de !: 


z(D=2(0)+z (0) +7 (0) +... +2 (0) +... (10.123) 


En dérivant le premier et le second membre de l’équation (121), 
on tombe sur 


= Ai Ar, oz Ac Az, ..., a = Az, ... (10.124) 


Les relations (121) et (124) ont lieu pour toute valeur de la variable 
t. Avec t = 0 elies deviennent 


z(0)=Az(0), 2(0)= A%z(0), ..., a" (0)=4"x(0), ... (10.125) 
La série (122) se met ainsi sous la forme 
z(n=z(0)+t4r (0)+5— pee HR = 


m(rras#E …)z(0), (10.126) 
c'est-à-dire selon (101) 


x (#)= eAtx (0). (10.127) 
Comine 
A2t2 342 
ete (E+ A+ +... )= A+ ANT ÉR+ = AeAt, 
(10.128) 


la substitution immédiate dans l’équation différentielle (121) montre 
que l’expression (127) est une solution de cette équation, qui vérifie 
les conditions initiales (122). 
Puisque (127) entraîne que 
z (to) = eAtoz (0), 
et d’après (116) 
eAtr (0) = eAt-to)eAtoz (0) = eAtt-to)x (4), 
l'expression (127) peut être ramenée à la forme 


z (t) = eAtt-tox (to). (10.129) 
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L'expression (129) est la solution de l'équation différentielle 
vectorielle (121) qui satisfait aux conditions initiales 


z=z(ts) pour é = to. (10.130) 
Considérons maintenant l’expression (71). En posant 
f (À) = et, (10.131) 


On à 
f(u)=en, f' A)= (ZT M), =tex, .., for )= 


9"RT! My, — 1 { 
= Ca ex) = Lx lent, (10.132) 
En vertu de (71), (131) et (132), la fonction eAt peut s’écrire 


eAt=— 2 (Zn + Zuot + +. + Zamit êmn!) en! (10.133) 


et la solution de (127) peut être ramenée à une forme contenant les 
composantes de la matrice À. 

Si l'on tient compte de la relation (133) on voit sans peine que 
la solution du système d'équations différentielles (118) obtenue 
en appliquant les fonctions d’une matrice coïncide (comme il se doit) 
avec la solution (4.124) obtenue au $ 4. (Au $ 4 le système examiné est 
du type plus général.) Cette correspondance justifie dans une certaine 
mesure la définition de la fonction d’une matrice adoptée dans la 
théorie des matrices (45). 

Examinons maintenant le système d'équations linéaires inho- 
mogènes 


dz s | 
= ÿ À jntr + f1(0) (J —=1,...,n). (10.134) 
k=1 
Le système d'équations différentielles scalaires (134) peut être 
remplacé par une équation différentielle vectorielle 
z = Az + f(b), (10.135) 
où par f(t) on désigne le vecteur 
fa(e) 
f()= re 
_ În (#) 
Cherchons la solution de l'équation (135) qui vérifie les conditions 
initiales (130) sous la forme 
x (t)= eAîz (1), (10.136) 
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= nt) — 
z(é)=| -.. |. (10.137) 
Zn (£) 


Les éléments du vecteur z ({) sont à déterminer. 
En portant l'expression (136) dans (135), on obtient 


où 


eAtz = f (#) 
ou 
z—e-Atf (t). (10.138) 
On en tire 
t 
(D =C+ | e-Atf (t) dt, (10.139) 
to 


avec C le vecteur composé de constantes arbitraires 


C 
c|. 1 (10.140) 
- Cn 


Maintenant l'expression (136) se met sous la forme 
t 


z(t)=eat(C+ | e-Aïf (x) dr). (10.141) 
t 


L'expression (141) entraîne que 
[x (#)}e=ro = e410C, 
d'où, compte tenu des conditions initiales (130), 
C—=e-Atoz (to). (10.142) 


En portant dans (141) la valeur trouvée de C, on obtient 
t 
z (é) = eAU-t0z (45) + | eAU-T)f (x) dt. (10.143) 
to 


C’est précisément la solution de l'équation différentielle vectorielle 
(135) sous les conditions initiales (130). 

13. Comparaison avec les solutions fournies par la transformation 
de Laplace. Montrons maintenant l'identité de la solution (143) 
et de la solution qu'on peut obtenir par les méthodes exposées au 
$ 4, fondées sur l'application de la transformation de Laplace. 
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En introduisant les notations 


E(p)æz(), f(p) 10), (10.144) 
on obtient qu’à l'équation différentielle vectorielle (135) 
z = Az + f(t) 
correspond la transformation suivante 
(PE — A) E (p) = px (0) + f (p), (10.145) 


où x (0) est la valeur de zx (f) avec t = 0. D'où 


E (p) = p (PE — A)-!x (0) + (pE — A)-!f (p). (10.146) 
On a en vertu de (89) 


2 D OA 
P(PE À) = À [Zu mt Zu (p— TRE + 
21p (mx —1) lp 
+ Zrs GR +... + Zam, un . (10.147) 
Désignons par À (t) l'original dont la transformée est la fonction 
p @E — 4)” 
p(pE — A)! N (+). (10.148) 
Compte tenu du fait que 
de 10.149 
GMT ul no 


on trouve 
N (t)= È [Zri + Zaot +... + Zi" # 7°] ent, (10.150) 
En vertu du théorème de multiplication des transformées 
{ 
+ p(PE—A)T(p) + | N(t—7)f(r)dr. (10.151) 
0 
Ainsi à la transformée (146) correspond l'original 
10=N@2:0)+ | N(t—7+)f(T) dr. (10.152) 
0 


La comparaison des expressions (150) et (133) montre que 
N(t)= et, (10.153) 
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ainsi (1952) se met sous la forme 


{ 
z (t)= eAtx (0) + | eAtt-0f (x) dr. (10.154) 
D'après (154) 
to 
z (to) = eAtoz (0) + | eAtto=0)f (rt) dr. (10.155) 
0 


L'expression (154) peut être ramenée à la forme 


to t 
z (t) = eA(t- to) ['eatez (0) + | eA(to—T)f (t) dr | + | eAtt-T)f (x) dr, 
0 Lo 


(10.156) 
d’où, en tenant compte de (155), on obtient 
t 


x (t) = eAUt-t0)x (to) + | eA(-T)f (x) dr, (10.157) 


ce qui coïncide avec l'expression (143). 
En remplaçant conformément à (153) la fonction et par N (t), 
récrivons l'expression (157) sous la forme: 
{ 
z(t)=N(t—to) x (to) + | N—t)f(t)dt. (10.158) 
Lo 
Remarquons encore qu’en vertu de (153), (114) et (115), la 


matrice !V (t) définie par l'expression (150) et la matrice inverse 
N”1(t) vérifient les relations suivantes: 


N(0)=E, (10.159) 
N(#)=N(—5), (10.160) 
NN ()=N(t—7). (10.161) 


Compte tenu du fait que 
eMt= E + A+ LT 


et que lors de la multiplication, les puissances des matrices sont 
commutatives, on obtient encore 


AN = NA. (10.162) 
Les relations (153) et (128) entraînent également 


= AN. (10.163) 
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$ 11. Commandabilité et observabilité des systèmes linéaires 


1. Commandabilité des systèmes décrits par des équations diffé- 
rentielles linéaires à coefficients constants. Considérons un système 
décrit par l'équation différentielle vectorielle 


À = Az+ Gu, (11.1) 
où 
TZ: D "Au Ain 
TZ = D | ss ss à dr : 
_ TIn An - Ann 
Gi: . Gir— ne Ui 
Cal ss: , üu=l ... |. (11.2) 
_Gni . Gnr Ur 


Nous avons désigné ici par z, (k = 1, ..., n) les variables qui 
déterminent l’état du système; par u, (1 = 1, ...,r), les com- 
mandes appliquées au système. On suppose que les éléments des 
matrices À et G sont constants. 

L'équation différentielle vectorielle (1) est équivalente au sys- 
tème d'équations différentielles scalaires 


; n r 
Le Y Ajtr+ > Gr (ES ... n). (11.3) 
k=i l=1 


Les équations (3) sont des équations différentielles linéaires 
à coefficients constants ; on peut les interpréter, par exemple, comme 
des équations aux variations (ou linéarisées) par rapport à un mouve- 
ment stationnaire (ou par rapport à l’état d'équilibre) d’un système 
de points matériels. Soit s le nombre de degrés de liberté de ce sys- 
tème, et q1, . . ., 4, ses coordonnées généralisées. Le rang du système 
d'équations (3) sera alors 

n = 2s. 


Les variables x; (i—1,...,n) des équations (3) peuvent être les 
coordonnées de phase ou variables canoniques (coordonnées géné- 
ralisées et impulsions généralisées) du système considéré de points 
matériels ou leur être associées par une certaine transformation 
linéaire. 

Puisque le nombre de forces généralisées appliquées à un sys- 
tème de points matériels ne peut dépasser le nombre de degrés de 
liberté, le nombre r des commandes u, (1 = 1, ..., r) des équations 
différentielles (3) doit vérifier la condition 


Tr LS 
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Notons encore que celles des équations du système (3) qui n’expri- 
ment que la relation entre les variables x;, par exemple les équations 
du type 


Tu — Titi (11.4) 


exigent, dans le cas où zx; sont des coordonnées de phase du système, 
qu'on ait les identités 


2 Gui: = 0 (HU = bi, sr LUs)s (11.5) 


ce qui exige que les lignes correspondantes de la matrice G soient 
composées d'éléments nuls 


Gun = Gus =... = Gyr = 0 (U = LU, - .., pe). (11.6) 


Toutefois dans le cas général, la structure d’un système de comman- 
de est plus complexe. Il comporte encore des organes de production 
des signaux de commande, etc. En outre, les équations (3) peuvent 
compter également des équations différentielles qui décrivent les 
programmes des calculateurs de commande appartenant au système, 
etc. Ces équations peuvent contenir également des commandes à 
elles. Dans ce cas on aura la relation #7 >> 2s, où par s on entend le 
nombre de degrés de liberté seulement de l’ensemble des éléments 
mécaniques appartenant au système (3); il se peut également que 
r>Ss. 

Examinons maintenant le problème qui consiste à ramener le 
système décrit par l'équation (1) d’un état initial donné à un état 
imposé quelconque pendant un intervalle de temps fini, en choi- 
sissant d’une façon convenable la loi de variation régissant les 
commandes u, = uy(t) (1 =1,...,r). 

La propriété qui vient d'être formulée s'appelle commandabilité. 
Les systèmes qui en jouissent sont dits complètement commandables. 

La commandabilité d'un système étant définie par la structure 
des matrices À et G, cette notion est également associée à ces matri- 
ces et l’on dit que le couple (4, G) est commandable ou, respective- 
ment, non commandable. 

Passons maintenant à la résolution du problème posé. D'après 
(10.143), la loi du mouvement du système décrit par l'équation 
(4) est de la forme: 


(4 
x (t)= eAtz (0) + | eAU-T)Gu (x) dr. (11.7) 
0 


Supposons qu'il existe une loi de variation des commandes 
u; = uj(t) (1—=1Â,...,r) telle qu’elle permet de ramener le 
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système à l'instant :—7 à l’origine des coordonnées, c'est-à-dire 
assure l'observation de la condition 


z (T) = 0. (11.8) 
Puisque d’après (7) 
z(T)=eAlz (0) + [ eAT-TGu (x) dr, (11.9) 
0 
on a en vertu de (8) la relation 
Î eAT-T)Gu (rt) dr = —eATz (0). (11.10) 


0 


En multipliant le premier et le deuxième membre de la relation 
(10) par e-AT, on obtient 


T 


| e-AïGu (x) dt = — (0). (11.11) 
0 
D'après (10.58) 
m—i 
2 ar (—T) A?, (11.12) 
=0 


où m est le degré du polynôme minimal + (4) de la matrice À, et 
&x (t) les coefficients du polynôme d’interpolation de Lagrange- 
Sylvester r (À) construit pour la fonction eit définie dans le spectre 
de la matrice À. 
En tenant compte de l'expression (12), la relation (11) peut 
s'écrire 
m— 1 T 
D A'6 | u (t)&x (—T) dt= —x(0) (11.13) 
k==0 0 
ou 


T T 
G\ u (r) ao (— 7) dr + 46 | u(t)æ(—Tt)dt+ ... 
0 0 
T 
. +4m16 | U(T)Œm-1(—T)dt= —x(0). (11.14) 
0 


Chacun des termes du premier membre de la relation (14) est an 
vecteur d'ordre nr X 1. 
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Le premier membre de la relation (14) peut être mis sous la 
forme d’un produit de deux matrices; la relation (14) s'écrit alors 
—T 


| u (tT) &o(—7T) dt 


[G AG AG. A"-1G] x — —z(0). (44.45) 


T 

| u (T) &m1 (—T) dt 

0 

Comme AG (k = 0, 1, ..., m — 1) est une matrice nr Xr, 
W= [G AG A°G ... A"-iG] (11.16) 

est une matrice partitionnée 4 X m. 


Faisons la remarque suivante. Selon (10.29), le polynôme minimal de la 
matrice À s'écrit 


PA)= A — A) (A — 0) (AA) (mime .…. +ms=m) 


ou 
YOA)=AMT+ CAMILLE... Lcm1À + cm. 
Etant donné que (À) est un polynôme annulateur de la matrice 4, c'est-à-dire 


Ÿ (4) = 0, 
AM c3AM IE... Hcm-14+cmE = 0. 


on a 


Il en résulte que 
AM = — Ami. —Cm_1A—cmE; 
c'est-à-dire que la matrice A" est une combinaison linéaire des matrices E, 
; ee AT 

Etant donné que AM*1— 4AmMm, Am+*? — A24M,,.. et que dans la multi- 
plication les puissances des matrices sont commutatives, on aboutit au résultat 
suivant. 

Si Le degré du polynôme minimal de À est égal à m, la matrice Ah (k > m) 
est une combinaison linéaire des matrices E, À, A, ..., AmM-1: 


m-1 
AR = à ep A) (k> m). 
2= 
Considérons maintenant la matrice (16). Puisque la matrice A*G, où k > m (et G 
est une matrice n X r), peut être mise sous la forme 


m—1 
AXG= Ÿ enyAiG  (k>m), 
j=0 
le rang de la matrice complétée 
W = [GAGA?G... Am-1G AMG AMG. . .], 


qui se forme par l'addition à la matrice W des éléments AMG, AmM+iG, ..., 
reste le même que celui de la matrice W. 
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En remplaçant dans (16) A“G (k = 0, 1, ..., m — 1) par les 
matrices correspondantes, on obtient la matrice nr X goù 


qg = mr, (11.17) 
dont les éléments sont des scalaires 
ks Ways ... Wig— 
ES (11.18) 
Was Was c.. Waa_ 


Les éléments de la matrice 


u (T) &o(—7T) dt 


MT 
T 
U = u (t) & (—T) dt 


(11.19) 
AR 
| U (T) Œm-1 (—T) dt 
0 = 
sont les vecteurs de dimension r, puisque d’après (2) 
Ui (t) 
=] (r) 
Ur(t) 
En introduisant les notations 
T 
Ui= | w(r)co(—t)dr, 
0 
T 
Us= | ue (r) co(— 7) dr, 
0 
U,= \|u,;(t)æ(—T)dt, (11.20) 


T 
U,= | Ur (T) Œm-1(—T) dt, 
Û 
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on peut mettre la matrice (19) sous la forme 
y - 
U=| ... |, (11.21) 
Us 
c’est-à-dire sous celle d’un vecteur (q = mr) de dimension q dont 


les éléments U, (k = 1, ..., q) sont des scalaires. 
L’équation vectorielle (15) devient ainsi 


WU = — x (0), (11.22) 


où W et U sont définies par les expressions (18) et (21). L'équation 
(22) est équivalente au système d'équations scalaires suivant: 


Wal + Was tee +WioUo = — 2 (0), 
| Ses (11.23) 


WU + WaaUe + ice + WaaÜao = — ïn (0). 


Dans ce qui suit considérons que le nombre de commandes r est 
choisi de façon à respecter la condition 


q=mÈ>n. (11.24) 


Ici, comme nous l’avons indiqué plus haut, m est le degré du poly- 
nôme minimal # (4) de la matrice À (de plus, m < n),et r, la dimen- 
sion du vecteur des commandes u. 

Si l'on désigne par w, les vecteurs colonnes de la matrice (18) 


Win 
Un = * (= 1l;:%::50), (11.25) 
Wan 


le système d'équations scalaires (23) peut être remplacé par l'équa- 
tion vectorielle 


q 
Ÿ WU y = — zx (0), (11.26) 
où wz (k — 1, ...,gqg) et x(0) sont des vecteurs de dimension 
net U, (k = 1, ..., q) des scalaires ; de plus, d’après (24), q > n. 
Ainsi, le vecteur x (0) est une combinaison linéaire des vecteurs 
Wn (k = 1, ..., q). 

Comme pour x (0) on peut choisir un vecteur quelconque de 
l'espace z,,..., 7, de dimension n, il résulte de la relation (25) que 
pour rendre le système (1) complètement commandable il faut et il 
suffit que parmi les vecteurs w, (k = 1, ..., q) il y ait n vecteurs 
linéairement indépendants. 


Ca 
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Autrement dit, la condition de commandabilité [36] du système 
(1) est que le rang de la matrice (16) 


W = (GAG A*G. . .A7G) 
soit égal à n. 

Lorsque qg > n, le système des variables U,, ..., U, qui véri- 
fient les équations (23) n'est pas unique. Le choix de la solution 
des équations (23) doit encore être guidé par les relations qu’imposent 
aux U,, ..., U, les formules (20). (Ainsi, par exemple, comme 
il s'ensuit de (20), les fonctions sous le signe de l’intégrale de U, 
et U,,, contiennent le même facteur u, (t) etc.) 

Après avoir trouvé U;,,..., U,, il faut, en se servant des rela- 
tions (20), définir la loi de commande u;=uj(t) (1=1,...,7r). 
La solution de ce problème n'est pas unique non plus. 

Toutes ces circonstances permettent d'imposer des conditions 
supplémentaires assurant telle ou telle allure du mouvement du 
système (conditions d’optimalité, etc). 

Montrons maintenant que si l’on connaît les variables U,, .. 

-… U 4 il est toujours possible de définir la commande (+). Cher- 
chons, par exemple, le vecteur fonction u (t), 4€ [0, T] sous la forme 


u (t) = &o (—t) Ko + (—t) Ki+...+am-1 (— À) Kms. 
(41.26) 


où an (— 1) (k = 0, 1, ..., m — 1), est un système de fonctions 

linéairement indépendantes qui font partie de l'expression (12), 

et Xo, X3, ..., Km-1, Certains vecteurs de dimension r à rechercher. 
Conformément à (19), on a 


(or &o) Ko + (is Co) A1 +... + (m-1r Lo) Am-1 = Los 
(&os Gr) Æo + (@us @i) Ki +... + (Gm-1r Gr) A m-1 = La 
(tos Am-1) Ko + (is m1) Æ1 + + - + + (&m-1s Am-1) Km-1 — 
D Pr 
Ici 
T 
(œi, a)= | œi(—T)a;(—T)dàr, 
0 
et L,, L,, ..., Lm_1 désignent les vecteurs de dimension r 


U: a 7 Urss  Uem-tyr+t 
Lo = DR Li = + ls -... Lm-1 = + 
— U, ° _Usr Le U; 
où les grandeurs U,, ..., U, sont fournies par l'équation (25). 


Dans ce système d'équations algébriques linéaires le déterminant 
composé de coefficients affectés aux X,, X,, ..., Kh-_, est non 
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nul du fait que c’est le déterminant de Gram d’un système de fonc- 
tions linéairement indépendantes. Ainsi, les vecteurs inconnus 
Ko, Kys + + Km-1 Sont définis d’une façon unique et, par consé- 
quent, il est toujours possible de déterminer la commande w (t) 
d’après les variables connues U,, ..., Us. 


Parmi les commandes possibles du type (26) il y a 
u (t)}=—G*e”A*tR-1Z (0), 


T 
R= | eATGG*e A dx, 
) 
et où l'astérisque désigne la matrice transposée. 
Voyons si à l'instant T, u (t) amène le système (1) à l’origine des coordon- 
_nées. A cet effet, portons u (t) dans le premier membre de la relation (11) 
T 
_ | eATGGte-A°T QtR-ix (0) = — RR-1x (0) — — x (0). 
0 
Ainsi la relation (11) est vérifiée, d’où l’on déduit en vertu de (9) que x (T7) = 0. 
Nous avons supposé'ici que la matrice R-! existe. Au point 6 nous démon- 


trerons que si le système est commandable, R est une matrice définie positive 
et, donc, la matrice inverse R-1 existe bien. 


Exemple. Examinons le système décrit par l'équation différentielle 
scalaire 


= ertu 


La commande u (t) devient alors 
Da 


u (t)= 4e 2T ect TZ (0). 
Le premier membre de la relation (11) s'écrit maintenant 
T T 
at. 2a - 2at 
{ eu (t) dt= = © 21 (0) | e dt= — x (U), 
4—e7°2T à 


c’est-à-dire la relation (11) est vraie, et d'après (9) on a z (T) = 0. 


2. Systèmes à une commande. Considérons maintenant un sys- 
tème décrit par les équations différentielles scalaires suivantes: 


EE S'ApratByu  Ü=lse..n). (11.27) 
k=! 


A la différence du système d'équations (3), le système considéré 
n’est muni que d'une seule commande u. 
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=] 
os | 


En introduisant les matrices 


T! E Ai: Ain PB: g 
— ’ A — . + + + + + , B — , (11.28) 
Tn =: An... Ann _ Ph En 
on peut remplacer le système (27) par l'équation vectorielle 
d 
= Az + Bu. (11.29) 


La matrice AYB, où v est un entier quelconque, étant une matrice 
colonne (vecteur), la condition de commandabilité obtenue au point. 
4 ne peut être respectée que si le degré du polynôme minimal 1 (4) 
de la matrice À est égal à nr. Ceci a lieu si toutes les valeurs propres 
de À sont simples. Si parmi ces valeurs il y en a qui sont multiples, 
le degré m du polynôme minimal (4) ne sera égal à n qu'au cas où à la 
valeur propre multiple correspond un seul diviseur élémentaire. 
Le ‘degré de ce diviseur élémentaire est alors égal à l’ordre de multi- 
plicité de la valeur propre. 

Si à la valeur propre multiple d’un système correspond non pas 
un mais plusieurs diviseurs élémentaires, le degré du polynôme 
minimal est m << n. En présence d’une commande unique, la con- 
dition de commandabilité de ces systèmes n’est pas observée. 

Pour les systèmes dans lesquels 


m=n, (11.30) 
la matrice (16) se met sous la forme 
Q = [B AB A°B... A"”!B]. (11.31) 


Les éléments de la matrice (31) sont des vecteurs de dimension nr 
et la condition de commandabilité du système est que le rang de la 
matrice Q soit égal à n. 

Le vecteur (21) s'écrit alors 


(11.32) 


[u(r)an4(—7 dr 


0 


Les éléments du vecteur Ÿ sont des scalaires. 
12—0393 
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Dans le cas considéré, l'équation (22) devient 
QV = —x (0). (11.33) 


Si la condition de commandabilité est vérifiée, c'est-à-dire si le 
rang de la matrice Q est égal à nr, le déterminant de Q est différent 
du zéro et l'équation (33) donne 


= —Q“x (0), (41.34) 


où Q-! désigne la matrice inverse. 
Conformément à (32), la relation vectorielle (34) est équivalente 
à nr relations scalaires 


(11.35) 


T 
Î 28 (6) ane (— 7) de = Han, 
0 


où x, — const (i = 1,...,n) sont les éléments du vecteur —Q-!x (0). 
La commande u = u (t) doit être choisie de façon à observer les 
conditions (35) qui ne déterminent pourtant pas d’une façon univo- 
que la fonction uw (t). 
3. Observabilité des systèmes décrits par les équations diffé- 
rentielles linéaires à coefficients constants. Examinons le système 
décrit par les équations différentielles vectorielles 


À 


dŒ 
7 = Az +Gu, (11.36) 
y=Cr+ Lu. (11.37) 


[ci z est le vecteur de dimension r ; y, le vecteur de dimension p;u, 
le vecteur de dimension r. Par À, G, Cet L on désigne les matrices 
nXn; nXr;, pXn; p Xr respectivement. 

Le vecteur zx est le vecteur d'état du système (ses composantes 
Lin > Zn sont les coordonnées de phase du système) ; u, le vecteur 
dont les composantes sont des commandes. 

Désignons par y le vecteur 


Cu 
y = . + ; 


Yp 
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dont les éléments y, ..., y» sont des combinaisons linéaires des 
coordonnées de phase zr ( = 1, ..., n) et des commandes v, 
— r). 
, done Lit que dans l'intervalle de temps 0<1<T 
les éléments y, . .., Un du vecteur y sont accessibles à à l’ observation 
et ainsi, d’après la mesure, on connaît les fonctions y, (4), ..., y» (t) 
dans l'intervalle de temps 0 < t < T. Supposons également connue 
la loi de variation des commandes u, == u, (t) dans l'intervalle de 
temps considéré 0 <1<T. 
Puisque d’après (7) 


t 
z (4) = eAtz (0) + | eAtt-T)Gu (t) dt, 
0 
on a en vertu de (37) 
t 
ÿ(t)= CeAiz (0) + C | eAU-DGu(r)dr+Lu(t). (11.38) 
Û 


Comme la fonction uw (t) est supposée connue, le deuxième et le 
troisième terme du second membre de (38) peuvent être calculés et 
ces termes peuvent être retranchés de la fonction y (4) obtenue par 
observation : . 


t 
yo—C | eAt-DGu(r)dr—Lu(t)=CeAt7(0). (11.39) 
0 


Nous connaissons donc le premier membre de la relation (39). 
L'état initial du système x (0) est supposé inconnu. On se deman- 
de si l’on peut obtenir la valeur x (0) d’après les données fournies 
par les observations exposées ci-dessus. 

Le problème que nous venons de formuler est équivalent au pro- 
blème suivant. Ramener le système décrit par les équations vecto- 
rielles (qui diffèrent des équations (36) et (37) du fait que u (1) = 0): 


= Ar, (11.40) 
y=Cz (11.41) 


à la valeur initiale z (0) en partant du vecteur fonction y (t) (0 < 
< t LT) établi par observation. 
La possibilité de ramener le système à l’état initial x (0) en 
partant de la sortie observée s'appelle observabilité. 
Les systèmes qui jouissent de cette propriété sont dits complète- 
ment observables. 
12% 
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Les équations (40) et (41) entraînent 
_ y (t) = CeAîz (0). (11.42) 
La matrice C qui fait partie de l'équation (41) est de la forme: 


(11.43) 


Gin Chr: Con 
En introduisant pour les lignes de la matrice (43) la notation C; 
G = 1, ..., p) 
C; = lcycje + ++ Cin] G = 1,..., p), (11.44) 
on peut la mettre sous la forme partitionnée 


Ex 
7 | (11.45) 
- Ch 


En vertu de (42), l'élément y; (£t) du vecteur y ({) peut s'écrire 
y; (t) = C'ieAtz (0) GÜ = 1,..., p). (11.46) 
D'après (10.58) 


m—-1° 
eAt— à ax (é) A*, (11.47) 
=0 
où m est le degré du polynôme minimal (À) de la matrice À, et 
œr (t) sont les coefficients du polynôme d'interpolation de Lagrange- 
Sylvester r (À) construit pour la fonction ext, définie dans le spectre 
de À. C’est pourquoi l’expression (46) peut être ramenée à la forme 
m—i1 

UE = 2 an(t)C;A"xz(0) (j=1,..., p). (11.48) 
En multipliant les premier et second membres de la relation (48) par 
œ (t) (i = 0, 1,..., m — 1) et en intégrant les fonctions obtenues 

par rapport à £ dans les limites de 0 à 7, on obtient 


T m—iT 
| œ(fy;()&t= » f (t)an(t)déC;A*x(0) (11.49) 
0 k=0 0 


(j=1, ..) P; i=0, : 7, m— 1). 
Introduisons maintenant les notations: 


T 
qu )= | qu te); (0) de. (11.50) 
0 
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En vertu de (49), on a pour tout j fixé le système d'équations suivant : 
(Go, Go) Cyr (0) + (mo, œ) CyAz (0) +... + 

+ (Go Am-1) CA" 1x (0) = (co, y); 
(œ, Co) Cyx (0) + (æ, œ) CjAz (0) D + 

+ (ais m1) CA Ex (0) = (ou, y), À (11.51) 


(œm-1» Go) C 57 (0) + (Gm-1, &1) C Az (0) + . . . + 
+ (Œm-1s m1) CA" 1x (0) = (m1, y). 


Le déterminant composé de coefficients affectés aux C;x (0), C;,Azx (0), 
..., CjA"-Iz (0) des équations (51) est différent du zéro 


(Go: Go) (Go; œi) ee (co, Cm-1) 
fee) re) em) Lo quisz 
(m1 %o) (Œm-1s Æi) +: + (mt Ém-1) 


du fait que c’est le déterminant de Gram {23, p. 79] d’un système de 
fonctions linéairement indépendantes @o (#), @ (t), . . ., @m-1 (4). 
Ainsi le système d'équations (52) possède une seule solution 


Ciz (0) =; 

CjAz (0) = Wie 

C;A 1x (0) = jm: 

Etant donné que j = 1, ..., p, on a v relations du type (53), où 
V = mp. (11.54) 


Introduisons maintenant les notations suivantes pour le produit 
scalaire de deux vecteurs & et n: 


(E, n) — En ne QUE Go re Entn- (11.59) 


Désignons par M* la transposée de la matrice M. Puisque la trans- 
position du produit de deux matrices M et NV donne lieu à la relation 


(MN)* = N*M*, (11.56) 

les équations (53) peuvent s’écrire 
(C7, x(0)) = hits 
(A*C?, x (0)) = bar 


(11.53) 


(11.57) 
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Conformément à (44) on a 
Cj=| * |. (11.58) 


Les matrices C*, A*C*, A#?C*, ..., A%"-1C* seront 


C1 Ca -.. Cpt 
CR MUR II cs 
Cin Con Cpn 
Ait Aa An Cat  C2i Cp1 
A*C*" = A4 A9 An < Cio Coo Cp2 _ 
Ain  Àon Ann Cin  C2n Cpn 


=[A*C* A*C? .. A*CS), 
ANC* =[ANC? AC? ... AC], 


A (11.59) 
ANM-ICS —[ANM-ICY ASM-ICS .., ASM-ICS], 


On voit de (59) et (57) que les colonnes des matrices C*, A*C®, 
A*?C*, ..., A*?*-1C* (le nombre de ces colonnes est v = mp) 
sont des vecteurs qui interviennent dans les premiers membres des 
relations (57). Les vecteurs concernés sont ainsi des colonnes de la 
matrice partitionnée suivante 


S = \CTARCRAMCE.:::, APPTCFI, (11.60) 


Remarquons que si les blocs de la matrice (60) sont remplacés par 
les matrices correspondantes, on obtient une matrice r X v (où 
v — mp) dont les éléments sont des scalaires. 

Supposons maintenant que parmi les colonnes de la matrice S 
il y a nr colonnes So,, Sos + «+» So, linéairement indépendantes, 
c'est-à-dire le rang de S est n. 

Supposons encore que la dimension p du vecteur y est choisie de 
façon à respecter la condition 


vV = mp Zn. (11.61) 
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Choisissons des v équations (27) celles dont font partie les vecteurs 
Sous Sos + + + Son: Ces équations sont 


(Sos: NA (0)) Fer os 
(So; T (0)) = Ho, 


| | (11.62) 
(Son: T (0)) = Hoh 
ou 
Soit Ti (0) + S 122 (0) re + S'oinTn (0) = Moi. 
S'o21T1 (0) + S'o2To (0) Fo SosnTn (0) = Mo», (11.63) 


S'on1Ti (0) + Son2Te (0) + AA + SonnTn (0) — Hon- 


Nous avons obtenu un système d'équations algébriques linéaires 
inhomogènes par rapport à x, (0), x, (0), ..., x, (0). Le déterminant 
composé de coefficients des équations (63) est non nul puisque les 
vecteurs Say, Sos + + + So, Sont linéairement indépendants et, par 
suite, le système d’équations (63) a une solution unique, c’est-à-dire 
qu'il détermine d’une façon unique les composantes zx, (0), x; (0),... 

..» Zn (0) du vecteur de l'état initial du système x (0). 

On peut encore donner aux relations (62) l'interprétation suivan- 
te. Les vecteurs linéairement indépendants So,, Sos + - +, San Peu- 
vent être considérés comme base de l’espace zx,, . . ., x, de dimension 
n. Les grandeurs l,, Us, - . ., Mo, Sont des projections du vecteur 
x (0) sur les vecteurs de base. Ces projections déterminent d'une 
façon unique le vecteur x (0) recherché. 

Ainsi la condition nécessaire et suffisante d'observabilité du système 


LL] 


(36), (37) consiste à égaler à n le rang de la matrice (60) 
S = [C* AVC A%°C® ..., AST-IC*]. 


Remarque sur l'inobservabilité. Supposons maintenant 


que le rang r de la matrice S soit plus petit que n. ne par SU*] la k-ième 
colonne de la matrice S et écrivons cette matrice sous la forme 


st s{2...s[" 
SET st21... sl] 


Notons que d’après (61) le nombre de colonnes de S 
V>n. 


On voit facilement que dans le cas de r < n, il existe des vecteurs z (0) 0 
qui vérifient les conditions 


(SCA], z (0)) = 0 (h=1, 9 v). (+) 
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En effet, les relations (+) peuvent s’écrire 
ST, (0) + SL ze (0) +... + SU zx (0) = 0, 
S1z4 (0)+ SFr (0) +... + Sr, (0) —0, (s) 


SÙIz, (0) + SV1ze (0) +... + SLlzn (0) = 0. 


Nous avons là un système composé de v (où v> n) équations algébriques linéai- 
res homogènes par rapport à n inconnues x; (0), r2 (0), . .., x, (0). La matrice 


des coefficients affectés à zx, (0), za (0), . .., zh (0) dansles équations (+) 


est la matrice S*, et comme le rang r de S est inférieur à nr, le système (++) 
a les solutions autres que la solution triviale 


z4 (0) 
Ze (0) 


Zn (0) 


z (0) = £ 0. 


Les colonnes de la matrice S étant les colonnes des matrices C*, A*C®*,... 
..., A*M-I1C%, les relations (+) entraînent que pour les vecteurs x (0) fournis 
par les équations (++) 


C;AËz (0) = 0 U=1,...,,. p;k=0,1,..., m—4). (s+e) 
De plus, d’après (48), 


m— 1 


yj()= D œn(t)CyAËz (0) (=, ..., p), 


c'est-à-dire 
y(t) =0 0O<t< oo U= À: pb): 


Ainsi dans le cas où le rang r de S est inférieur à n, il existe des états ini- 


tiaux du système z (0) : 0 non uniques et non nuls tels que le vecteur fonction 
y (t) = 0, 0 < t << co. Ceci traduit précisément l’inobservabilité d'un système. 

Remarquons que y (t) = 0, 0 < ? << © également dans le cas où l’état 
initial du système est nul x (0) = 0. 


4. Systèmes à une coordonnée observable. Considérons mainte- 
nant un système décrit par les équations 


dz ñn 

= > À jhTh (=1, es A). (11.64) 
k= 

y = >. ChTke (11.65) 
Rk=1 


A la différence des équations (40), (41), les observations ne rensei- 
gnent ici que sur la fonction scalaire y = y (t) déterminée par l'ex- 
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pression (65), et non sur le vecteur fonction, comme c'était le cas 


du point 3. 
En introduisant les matrices 
| Zy | | Au... Ain 
TZ = ; 7 : C=[c, Ca ... Cn}» (11.66) 
LL Tn L Ans... Ann J 
on peut récrire les équations (64) et (65) sous la forme: 
dz 
. (11.68) 


Conformément à (66) la matrice C* étant une matrice colonne (vec- 
teur) 


C° — _ ’ (11.69) 


la matrice A**C*, où k est un entier quelconque, est une matrice 
colonne (vecteur). C’est pourquoi la condition d'observabilité du 
point 3 ne peut être respectée ici que si le degré du polynôme minimal 
4 (À) de la matrice À est égal à n. Ceci n’est possible que si à chaque 
valeur propre multiple de À correspond un seul diviseur élémentaire. 
Pour les systèmes à une coordonnée observable, dans lesquels 


m=n, (11.70) 

la matrice (60) s'écrit | 
P =[C* A+C* ANCY ... AVNICS]L (11.71) 
Les éléments de la matrice (71) sont des vecteurs de dimension n 
et la condition d'observabilité du système est que le rang de la 


matrice P soit égal à nr. 
Le problème considéré donne lieu à x équations suivantes du 


type (97) 
(C®, x (0)) = fi, | 
(A*C*, z(0))}= he 
(ANC*, z(0)) = ps, (11.72) 


(ASC, x (0)) = un. ) 


Si les vecteurs C*, A*C*,..., A*7-1C* sont linéairement indé- 
pendants, ils forment la base de l’espace z,,..., x, de dimension #7. 
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Les grandeurs p,, LU, . .., u\ Constituent alors les projections du 
vecteur z (0) sur les vecteurs de base. Ces projections définissent le 
vecteur zx (0) de façon unique. 


9. Dualité dans la théorie de commandabilité et d’observabilité. 
Examinons le système I décrit par les équations 


dx 
— = Az+Gu, | 


Me (11.73) 
== 172 


Ici x, u, y sont les vecteurs de dimension n, r et p, et 4, G, C, L, 
les matrices zn Xn,nxXr,pXn,pXxr. 
La condition de commandabilité est que le rang de la matrice 
W = [GAGA°G ... AG] 
soit égal à nr. 
La condition d'observabilité est que le rang de la matrice 
S.= [CR ASCFANC® ;:,, APMACY] 
soit égal à n. 
Soit le système II décrit par les équations 


ARS 
n = G'E + L'v. 
Ici £, v, n sont des vecteurs de dimension n, pet r. 


Pour le système II la condition d’observabilité est que le rang 
de la matrice 


5, = IC ATCF ACT 2 APPIC*] 


(11.74) 


soit égal à n. 
La condition d’observabilité du système II est que le rang de la 
matrice 


W = [GAGA*°G ... AG] 
soit égal à n. 

Nous sommes donc ici dans le cas du principe de dualité dans le 
problème de commandabilité et d’observabilité, établi par Kal- 
man [36]. 

Le système 1 est commandable (observable) si et seulement si le 
système II est observable (respectivement commandable). 

6. Commandabilité des systèmes linéaires non stationnaires. 
Examinons le système linéaire non stationnaire décrit par l'équation 
différentielle vectorielle 


= A(Dr+G (Hu. (11.75) 
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où . 
TE TZ! 7 Au (£) a Ain | \ 
z=| |, A (t) ES EEE : 
L Th 1 A1 () ET (é) | | 
u 7 Gus (#) + Car () 7 | 02479) 
U — . G (£) = ssh ads etui : 
ur | Guit) ... Got) | ) 


Les éléments des matrices À (t) et G (t) sont des fonctions réelles 
continues du temps. 

Le système (75) est dit complètement commandable à l'instant ts 
si l'on peut le faire passer en un intervalle de temps fini de l'état où 
il se trouve à l'instant ?, à l’état nul en choisissant dûment la loi de 
variation des commandes u, = uy(t) (1=1,...,r). 

Les propriétés d’un système non stationnaire se modifiant dans 
le temps, il existe des systèmes commandables (au sens de la défi- 
nition donnée ci-dessus) à l’instant T et non commandables à n’im- 
porte quel autre instant ultérieur. La définition même de la com- 
mandabilité implique que si le système est commandable à l'instant 
T, il l’est également à n'importe quel instant t, << T (du fait qu'il 
sera commandable à l'instant T, quel que soit son état). 

Théorème. Soit Olt, t) —=6(1)60-!(x), où O(t) est la 
matrice fondamentale des solutions du système décrit par l'équation 
différentielle vectorielle homogène 


dr 
7 = A(t)z, (11.77) 
et W (to, t) la matrice | 


{ 
W (bo, = | D(t T)G(T)G*(T)D° (4, Thdt. (11.78) 
to 


Le système linéaire non stationnaire (75) est commandable à l'ins- 
tant t, st et seulement si pour un certain t, fini la matrice W (t,, t:) 
déterminée par l'expression (78) est une matrice définie positive *. 

Démonstration. 

1°. Par hypothèse, la matrice W (£,, t,) est une matrice symé- 
trique définie positive. Par conséquent, c'est une matrice régulière, 
c'est-à-dire det W (t,, 1) 0. 

Ainsi l'inverse W-! (4,, 1.) existe bien et le vecteur des comman- 
des x (t) peut être choisi sous la forme: 


u (t) = —G* (1) D (4, D W(t, ti) x (bo). (11.79) 


* La matrice R(nXn) est dite définie positive si la forme quadratique 
(6, RE) (où E est un vecteur de dimension n) est positive pour tout E + 0. 
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Puisque d’après (7.26) 
z(t)=O(é, to) (to) + O(é, t)G (t)u (x) dt, (11.80) 
à l'instant ?{ = t, l’état du est 
x (ti) = D (1, Lo) & (to) + lo, t)G(t)u(r)dt. (11.81) 
to 


En portant dans (81) l'expression (79) pour w (t), on obtient 
z(ti)=O (ti, Lo) Z (Lo) — 
T 


— | Ou, T)G(T)G* (x) D" (to, t)dtW-t(to, H)z(to). (11.82) 
to 


Nous avons montré plus haut (7.24) et (7.25) que 
D (£ Lo) D (to l) _— E, 
O (os 41) D (us 7) = ® (to T). 
Donc, on a, compte tenu de (78), 


{1 
jo, r)G(t) G* (x) D* (to, T) dr = 
to 


t1 


= O(t4, to) | Dé 4)D(4, TG (r)G*(T)D* (b, T)dr = 


L 
| =D (t4, 4) Wto t). (11.83) 
En vertu de (82) et (83), l’état du système à l'instant & = £, s'écrit 
z(t) = D (4, to) 2 (to) — D (6, to) W (£os t3) WT (los 1) & (to) = 0. 
(11.84) 


Ainsi, à l'instant { = £,, le système (75) est en effet recalé à zéro. 

Remarquons que la commande w (t) donnée par l'expression (79) 
qui, comme nous l'avons démontré, ramène le système (75) à zéro à 
l'instant #,, n'est pas unique. En effet, en vertu de (81), à l'instant 
t = t, la commande 

u(t)=u(t) +), 

où v (1) est un vecteur fonction quelconque de dimension r vérifiant 
la condition 


{1 
| O4, t)G(t)v(r)dt=0, 
to 


amène également le système (75) à zéro. 
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D'une façon analogue à linstant { — !, la commande 

u (4) = —G* (+) D* (lo, À) W (to, 4) Lt (to) — D (to, t1) 2%] 
amène le système au point zx {(£,) = x*. 

2°. Montrons maintenant que si le système (75) est commandable, 
la matrice W (6, 1.) est définie positive. 

Considérons d’abord la forme quadratique (&, W (4,, 11) E), où E 
est un vecteur de dimension nr. D'après (78), on a 


{1 
Œ, WE= |, OGG*@*E) ar. (11.85) 
to 
Etant donné que pour toute matrice rectangulaire a du typen Xr 
(E, aa*E) = Efaa*é, 
(a*E)* = £a, 
(aŸE, aŸE) — (a*E)* a*E — Efaafë, 
il vient 
(E, aa*E) = (a*E, a*E). (11.86) 
Ainsi, conformément à (86) et (85), tout E donne lieu à la relation 
{1 
(ë, WE)= | (G*O'E, G*O*E) dt > 0. (11.87) 
to 
Pour achever la démonstration, il faut encore prouver que la 
matrice W est régulière; la relation (87) acquiert alors la forme 
requise (ë, WE) > 0. 


Raisonnons par l'absurde: soit W une matrice singulière. Il 
existe alors un vecteur v = 0 tel que 


(v, Wv) = 0. (11.88) 
Désignons maintenant par *x (4) le vecteur 
x (4) = —G* (1) D (4, 0) v. (11.89) 


En vertu de (89), x (t) est une fonction continue de £. Conformé- 
ment à (89), (86), (78) et (88), on a 


ts ts 
| {x(£), x(t)) dt — | (G*O*v, G*O*wv) di — 
to to 

Ît {4 


= | (v, DGG*D®w) dt = (€ | DGG*O* dt v) =(v, Wv>=0 (11.90) 
to to 
d'où il résulte 
x(D=0 (bELI<t). (11.91) 
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Retenons maintenant que par hypothèse le système concerné est 
commandable. Par conséquent, il existe une certaine commande 
u (1) qui amène le système de l’état v = O0 (à l'instant #,) à l'état 
nul (à l'instant t,). D'une façon analogue à (81), on a la relation 


ts 
0 = © (#1, h)v+ | D (ti, )G(t)u(t)dt. (11.92) 
to 


Il en résulte que 
{1 
v= —O(#, ti) | O(hu, t)G(t)u(t)dt, 
to 
ou 


T 
v— — (ht, t)G(t)u(t)dt. (11.93) 
to 


On tire de (91) et de (89) que 
1 ts 
0— | (u(t), u(#)) dt = — | (G*(#)D® (to, 1)v, u(t)}dt. (11.94) 
to to 


Puisque pour toute matrice rectangulaire a on a 
(a*v, u) = (a*v}* u = vtau = (v, au), 


la relation (94) entraîne 


{1 
— | (v, Dé, t)G(t)u(t)}dt= 


{1 


(€ Les DG(Wu()dÿ=0. (11.95) 


D'après (93) la relation (95) se met sous la forme 
(v, v) = 0, (11.96) 


ce qui contredit l'hypothèse initiale suivant laquelle v = 0. 

Cette contradiction résulte de l'hypothèse (88) que la matrice 
W (to, 1) est singulière. Nous avons donc établi que W (4,, t,) est 
une matrice régulière, c’est-à-dire la relation (88) n’est vraie pour 
aucun vecteur v = Ô et, par conséquent, 


(v, Wv) & 0. (11.97) 
‘Les relations (87) et (97) entraînent que 
(6, WE) > 0, (11.98) 
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c'est-à-dire si le système (75)'est commandable, W (4,, t,) est une 
matrice définie positive. 

7. Observabilité des systèmes linéaires non stationnaires. Con- 
sidérons maintenant le problème qui consiste à restituer la valeur 
initiale x (£,) d’après le vecteur fonction y (t) (t, < t  T) fourni 
par les observations pour le système 


= A(z, (11.99) 
y(t)=C(t)x. (11.100) 


Ici x est le vecteur de dimension n; y, le vecteur de dimension p; 
À (t), la matrice n X n; C'(t), la matrice p X n. Les éléments des 
matrices À (t) et C (t) sont des fonctions continues réelles du temps. 
Si tout état initial x (t,) peut être déterminé d'après le vecteur fonc- 
tion y (t) connu dans l'intervalle [t,, T], dans cet intervalle le système 
est dit complètement observable. 
D'après (80) et (100) 
z (t) = O (é, to) z (to), (11.101) 
y() = C(D O(E, 10) x (to). (11.102) 
En multipliant à gauche le premier et le deuxième membre de (102) 


par la matrice @* (f, £,) C* (t) et en intégrant par rapport à { de #, 
à TZ, on obtient 


T T 
| D (4, t)C*(t)y(t) dt= | D° (4, b)C* (1) C() ®(, to) dt x (to). 
to to 


(11.103) 
Introduisons les notations 


T 
M (to, T)= j œ (t, 4)C* (CO O(E, t)dt, (11.104) 
lo 


T 
nt, T)= | O*(i, 40) C* (E)y (9 à, (11.105) 


pour écrire la relation (103) sous la forme 
M (toy T)z (to) = 1 (to T). (11.106) 


Si la matrice M (t,, T) est régulière, c’est-à-dire si son déterminant 
diffère du zéro, il existe la matrice inverse M”! (4,, T), et l'équation 
(106) peut être résolue par rapport à zx (4,): 


Z (to) = MT (to T) 0 (to T). (11.107) 
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De la sorte, si la matrice M (t,, T) est régulière, le système (99), 
(100) est complètement observable. 

Montrons maintenant que si le système est complètement obser- 
vable, M (ts, T) est une matrice régulière. 

Supposons que la réciproque est vraie: soit M (t,, T) une matrice 
singulière et 


(u, Mu) = 0. (11.108) 
Prenons le système à l’état initial 
z(t) =u #0. (11.109) 
D'après (102), sous la condition initiale (109), la fonction y (t) 
s'écrit 
y (D = gq (1), (11.110) 
avec 
ga(D =C(t ©, to) u. (11.111) 


Si l’on tient compte que 
(CDu, CŒOu) = (COu)* CDu = u*D*C*CŒOu = (u, D*C*CDu), 
on a en vertu de (104) et (108) 


T T 
fut, atpa= | (Cou, Cou) 4 
to 


à T T 
= fe, D'C*COp) dt = Çn, joccoap)=(u, Mu) =0. (11.112) 
tn lo 
Il résulte de la relation (112) que 
g(t)=0 (to Lt LT). (11.113) 


Dans un système complètement observable, avec x (t,) 0, le 
vecteur fonction y (t) vérifie la condition 


y AO  (o<t<T), (11.114) 


ce qui contredit les relations (113) et (110). 

Cette contradiction résulte de l’hypothèse (108) suivant laquelle 
la matrice M (t,, T) d’un système complètement observable est singu- 
lière. Par suite, si un système est complètement observable, la matrice 
M (to, T) est régulière. 

Nous avons ainsi démontré le théorème suivant. 

Le système (99), (100) est complètement observable dans l'intervalle 
[to T] si et seulement si 


T 
M (to: T}e= | O*(t, 4)C*(HC(DO(t, dt 


est une matrice régulière. 
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Notons que puisque M (t,, T) est une matrice de Gram, si 
det M (to, T) 5 O (comme c’est le cas du théorème qui vient d’être 
démontré), M (to, T) est une matrice définie positive. 

8. Condition de commandabilité d'un système linéaire station- 
naire dans un problème aux extrémités libres. Considérons le sys- 
tème décrit par les équations vectorielles 


dz -- 
a “Az+Gu | (11.115) 
y=Cx, 
où 
T 4 7 | A4 aie Ain | T'Gu SES Gir 1 | 
T = . | US | G — . + © + + + , 
L Zn LA: . Ann | LG: CP Gr] | (11 { 16) 
E Li 7 = Us 7 | C1 . Cin Î 
U = ; l = . | C | . + + + s | 
[= Uy a LE Up C;,1 .. Cyn_} 


Les éléments des matrices À, G et C sont supposés constants. Le 
rang du polynôme minimal 14 (À) de la matrice À est égal à m. 
Désignons par zx, (k = 1, ..., n) les coordonnées de phase du 
système, par u](l = 1,...,r) les commandes qui lui sont appliquées. 
3 Ü=1, ..., p; p Ln) désigne les combinaisons linéaires 
des coordonnées de phase z,, ..., x, déterminées d’après (115). Le 
but de la commande est d’amener le vecteur y (t) à l'instant t — T 
à l’état donné 


y(T)=K (11.117) 
Conformément à (115) l’équation vectorielle (117) est équivalente 
au système d’équations scalaires 


n 


en (T)=K; (=; ; D) (11.118) 


Les conditions (118) traduisent le fait que le point représentatif 

(Zi, - « +, Zn) doit être ramené à l'instant & = T dans le plan de di- 

mension (7 — p) de l’espace X de dimension » défini par les relations 
n 


2 nt =E; (j=1, .., p). (11.119) 


Les conditions qui rendent possible cette opération s'appellent 
[36] commandabilité par rapport à y. 


Théorème. Pour que le système (115) soit complètement com- 
mandable par rapport à y, il faut et il suffit que le rang de la matrice 
P = (CGCAGCA®G. . CA"1G] (11.120) 
soit égal à p. Ho 
13—0393 
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Démonstration. Puisque d’après (115) 
t 


(D =eAtr ()+ | eAt-9 Gu (x) dt, (11.121) 
0 
la relation (117) devient 
T 
C | eAT-9 Gu (t) dr = —CeATz (0) + K. (11.122) 


0 
En désignant par z (t) le vecteur 

z (t) = CeAtz (0) — X, (11.123) 
la relation (122) peut s’écrire 


T 
C | eAT-0 Gu(t) dr = —2(T). (11.124) 
D'après (10.58) 
m— | 
eAT-9= N (T7) Ar, (11.125) 
—0 


et c'est pourquoi 
m-1 T 


T 
c\ eAT-9 Gu(r)dr= 3 CA*G u(t)ax(T—Tdr. (11.126) 
0 k=0 
Maintenant la relation (124) peut se mettre sous la forme 
en = 


fu (x) &(T— t) dt 


[CG CAG CA°G ... CA1G] x = — (7). 


| u (T)&m1 (T — T) dt 


(11.127) 


Considérons ensuite que le nombre de commandes r est choisi tel 
qu’il respecte la condition 

g=mrT>p. (11.128) 

La matrice P, définie par la relation (120), est une matrice rec- 


tangulaire p X q: 
[ Pas Pas :. Pia 
=] | : (11.129) 


Phi Pa co Ppq 
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Désignons par £ le vecteur dont les éléments E; (j — 1, ..., Q) 
sont de la forme: 


C | 
= \ ui (t) &o (7 —+T) dr, 

T 
Es = | us (9) ao (T —) dt, 

0 
RDA 
&= [u,(r)æo(T—+)dr, (11.130) 

0 

T 

Es = | Ut (t) Œ: (T — 7) dx 

0 


— { Ur (T) Gm-1 (T —T) dt. 
0 


L'équation vectorielle (127) devient ainsi: 
PE = —2(T). (11.131) 
A l'équation vectorielle (131) correspond le système de p équations 


scalaires par rapport à q (où g > p) inconnues E&,, ..., E,: 
Pinër + Probe + +. + Pigba = He (T), 
ue EL is | (11.132) 
PE + Ppebs +. .+ PpaËa = 7 2h (T). 
Si l’on note par Il, (k = 1, ..., g) les vecteurs 
| Pia 
u ... |, (11.133) 
Pph ei 
on a pour le système dé’quations (132) 
q 
2 ILEx = —2(T). (11.134) 
De cette façon le vecteur 
[ (T7) 
z(T)= . 
Lzp (T7) 1 
est une combinaison linéaire des vecteurs Il, (4 = 1, ..., q), où 


g > p. Le vecteur z (T) pouvant être quelconque, la condition de 
13° 
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résolubilité de l'équation (134) par rapport à £,,..., &, entraîne que 
pour rendre le système (115) complètement commandable par rapport 
à y il faut et il suffit qu’il existe parmi les vecteurs Il, (4 — 1,...,Q) 
p vecteurs linéairement indépendants, c’est-à-dire que le rang de la 
matrice P soit égal à p. Le théorème est démontré. 

Si q > p, le système des variables E,, . .., Ë, vérifiant les équa- 
tions (132) n'est pas unique. Une fois les variables ë. ..., 6q trouvées, 
il faut définir d’après les relations (130), la loi de commande u, = 
= u(t) OLILT;l—=1,...,r). Ce problème admet également 
plus d’une solution. 

Montrons à titre d'exemple que parmi les commandes possibles 
qui observent la condition (117) 


y(7) = K 
il y a la commande 
u(t)= —G'eA"T-HC°Y-1[CeATx (0) — K]. (11.135) 
où W désigne la matrice carrée pXp 
T 
Y=— | CeA(T-0 GG'eAT-0C% ar. (11.136) 


0 
En effet, pour u—=u(t) on a 
T 
CeaT| e-AtGu(t) dt = 
0 


CeAT-9 GG*eA T-9C° dx W1[CeATz(0) — K] = 


= —CeATz(0)+X. (11.137) 
Conformément à (115), (121) et (137), pour y (T) il vient 
T 


y(T) = CeATz (0) + | CeAT-nGu(r)di=K. 


c'est-à-dire la relation (117) est vérifiée. 

Nous avons supposé précédemment (135) l'existence de la matrice 
Y-1. Au point 9 nous allons montrer que si le système (115) est com- 
plètement commandable par rapport à y, VW est une matrice définie 
positive, et, par conséquent, l’inverse W-' existe bien. 

9. Condition de commandabilité d'un système linéaire non sta- 
tionnaire dans un problème aux extrémités libres. Etudions pour un 
système décrit par les équations vectorielles 


dz 
PS) (11438) 
y=C(E)x, 
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où . 
T zx | | Au(t) -.. Ain(t) | 
z=| .- .. |, A (t)= TESTS TR. | 
L OTn L An1(£) +. Ann (t) 
T Gui (£) - . Gir (4) 
cwb=| dr ue SA er UE ] 
LGn:1 (€) - .. Gnr (6) À 
[| WU | | y: D C11(£) -.. Ciné) 7 
u = | uæl «.- |, C=| ......... , (41.139) 
L Ur Up LCpi(t) -.. Cpn(t) D 


le problème qui consiste à ramener le vecteur y (t) à l'instant t = 4, 
à l’état donné 


y (4) = À. (11.140) 


Ce problème a été étudié au point 8 pour les systèmes linéaires 
stationnaires où la possibilité d'observer la relation (140) a été nom- 
mée commandabilité par rapport à y 

Théorème. Soit Oit, t) "6 (9 8-1 (». où G6(t) est la 
matrice fondamentale des solutions du système décrit par l'équation 
différentielle vectorielle homogène 


dx 
= A(tz, (11.141) 


et V (to, t1) La matrice 


V (to, u)= | C(h)D(4, T)G(T)G*(T)D*(H, T)C*(éi)dT. (11.142) 
to 


Le système linéaire non stationnaire (138) est complètement commandable 
Par rapport à y dans l'intervalle de temps to < t < 1, si et seulement 
si la matrice V (t,, t,) déterminée par l'expression (142) est une matrice 
définie positive. 

Démonstration. 

1°. Par condition V (to, t;) est une matrice définie positive. Il 
en résulte que c’est une matrice régulière, c'est-à-dire det V (to, 4) 
7 0. C'est pourquoi la matrice inverse V-! (£,, £,) existe bien et 
on peut choisir le vecteur des commandes u ({) tel que 


UE) = —G* (4) O* (4, 2) C* (4) V (to, 4)LC (41) D (4, to) z (to) — KI. 
(11.143) 
D'après (138) l'état du système à l'instant { — 4, s'écrit 


ti 
z (ts) = D (4, to) x (to) + | Os, T)G(t)u(t)dt. (11.144) 
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Avec la commande w = ü (t) on a, grâce à (138) et (144), 
ts 
y (4) = C (é1) T (41) = C (1) D (£1, Lo) TZ (Lo) + C (ti) | D (1 T) G (t) u(t) dr. 
Lo 


(11.145) 
Comme 


t4 
C(&:) fou. r)G(r)ü (x) dr = 
lo 


{1 


_— | C4) D (4, T) G(r)G* (x) D" (4, +) C' (41) dt V1 (bo, ts) X 


X [C (4) D (ti, to) z (to) —K]= —C(t4:)OD(t1, t)z(to)+Æ, (11.146) 
l'expression (145) devient 
y (ti) = À. 


Ainsi, la commande u (t), déterminée par l'expression (143), assure 
l'observation de la relation (140). 


Notons que la commande v (t) donnée par l'expression (143), qui, 
comme nous venons de le démontrer, amène le vecteur y (t) à l’état 
y (ti) = À, n'est pas unique. En effet, la commande 


u()=u() +vt(t), (41.147) 


où v (t) est un vecteur fonction quelconque de dimension r vérifiant 
la condition 


tt | 
C(H)| O(4, TG(x)v(r)dr=0 (11.148) 
Lo 


amène également d’après (145) à l'instant { = £, le vecteur y (+) 
à l’état y (1) — X. La première partie du théorème est démontrée. 
2°. La démonstration de la deuxième partie du théorème selon 
laquelle si le système (138) est complètement commandable par 
rapport à y, la matrice V (f,, £,) est définie positive, reprend fi- 
dèlement la démonstration de l'affirmation analogue relative à la 
matrice W (to, t,) formulée au point 6, section 2°, p. 189. 


CHAPITRE 4 


MÉTHODE DE PROGRAMMATION DYNAMIQUE 


$ 12. Commande optimale des systèmes 
à ressources restreintes 


1. Problèmes variationnels dans la théorie de la commande. 
Lors de l’étude des problèmes de commandabilité au $ 11 nous n’avons 
pas imposé aux commandes des contraintes a priori. Nous avons 
également considéré comme admissible (dans le choix de telle ou 
telle commande) toute loi de variation dans le temps des coordonnées 
de phase du système. 

Or, en pratique les ressources d’un système commandé sont limi- 
tées. Ainsi, par exemple, des contraintes sont possibles limitant le 
module de la commande, la puissance de sa source, etc. Il se peut 
également que pour telle ou telle raison les écarts admissibles de 
certaines coordonnées de phase du système soient limitées, etc. 

Le choix de la loi de commande (c’est-à-dire de la loi de variation 
des commandes), compte tenu des contraintes citées, est guidé par 
le but imposé. Dans le cas général, on peut admettre que le but de 
la commande est d'obtenir l’extrémum d'une fonctionnelle qui 
caractérise le critère d'optimalité du système 


Q(z, z,u, t) = min. (12.1) 


Ici x est le vecteur de dimension » dont les éléments z,, ..., 
sont les coordonnées de phase ; z, le vecteur de dimension m dont 
les éléments z,, ..., zM sont les signaux d'entrée à reproduire par 
le système ou à transformer de la façon donnée; u, le vecteur de 
dimension r dont les éléments u,, . .., u, sont les commandes: #, 
le temps. 

La fonctionnelle Q est un nombre dépendant de la forme des 
vecteurs fonctions x (f), z (t) et u (t). Ainsi, par exemple, la fonction- 
nelle Q peut s’écrire 


m T 
Q= 3 | Iro,(E)—21 (E)Y° dt, (12.2) 
0 


où 7 est une grandeur fixée. La fonctionnelle Q qui, d’après (2), 
dépend de la forme des fonctions zo, (t), z4 (4) (ë = 1, ..., m) dans 
l'intervalle de temps 0 < t<< T, est la mesure de la qualité de 
reproduction par le système du signal d'entrée vectoriel z (4). 
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. Dans de nombreux problèmes on demande que la trajectoire du 
point représentatif, qui passe par deux points donnés z (0) et x (7) 
de l’espace de phase, où T est une grandeur fixée (c'est-à-dire que 
la trajectoire de phase qui amène le système de l’état initial x (0) 
à un état donné x (T°), où 7 est un instant donné à l'avance), minimise 
ou maximise la fonctionnelle 


T 


Q= Î G{x(t), u(b), t)dt, (12.3) 


avec G, une fonction scalaire bornée des variables z;, ..., z,, 
Us Mas + + es Uys À. 
La forme de la fonction G (x, u, t) se définit pour chaque problème 
concret. Ainsi, si l’on donne l'état final x (T) sans fixer à l'avance 
l'instant final 7 et si la fonction G s'écrit G = 1, on tombe sur 
Q = T,et la condition (1) Q = min devient T = min. On aboutit 
ainsi à un problème de réponse en temps minimal dans lequel il 
faut établir la loi de commande u = u (t) vérifiant les contraintes 
imposées à z telle qu’en un temps minimal T le système serait amené 
de l'état initial x (0) à l’état final prévu zx (T). 

Ce qui précède caractérise la position des problèmes de comman- 
de optimale. Ce sont des problèmes variationnels qui consistent à 
rechercher l’extrémum lié des fonctionnelles dont la forme est dé- 
terminée par le critère d'optimalité adopté. 

2. Méthode de programmation dynamique de R. Bellman. Prin- 
cipe d’optimalité. Considérons un système de commande décrit par 
le système d'équations différentielles scalaires 


TL = f;(xs, es ns is cs Ur) = ... n). (12.4) 


Ici x,,..., x, sont les coordonnées de phase du système; u,,...,u,, 


les commandes. 
En introduisant les vecteurs 


7 fa (tt os Lns Us ce Ur) | 


În (21: CRE | Tn) Ui; CP Ur) _ 


on peut remplacer le système (4) par l'équation différentielle vec- 
torielle : 


= j (5 u). (12.6) 
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En posant que les commandes ,, . .., u, sont soumises à certai- 
nes contraintes, demandons que leur choix soit guidé par l’observa- 
tion de la condition 

| u € (, (12.7) 


où (2 est un domaine de l'espace (u,,..., u,), défini par la forme des 
contraintes imposées. 

Supposons que le but de la commande consiste à minimiser la 
fonctionnelle 


T 
Q= | G(z(). u () dt, (12.8) 
0 


où G est une fonction scalaire bornée des variables x,, ..., zh, 
U, . - ., Ur, et T, une grandeur fixée donnée. 

La méthode de programmation dynamique est basée sur le prin- 
cipe d'optimalité énoncé par R. Bellman {8]. Ce principe est vrai 
pour les systèmes dont le mouvement ultérieur est complètement 
défini par leur état à un instant courant quelconque. Tels sont, par 
exemple, les systèmes régis par les équations différentielles (4), où 
par état on entend la position du système dans l’espace de phase, 
les systèmes décrits par les équations aux différences finies à variable 
discrète, etc. Voici la formulation du principe d'optimalité de 
R. Bellman. 

Un comportement est optimal si, quels que soient l'état initial et 
la solution à l'instant initial, les solutions ultérieures constituent un 
comportement optimal par rapport au résultat de la première solution. 

Cette formulation du principe d’optimalité (qualifié par Bellman 
d’intuitif) concerne une classe très générale des systèmes. Par « com- 
portement » des systèmes commandés décrits par les équations diffé- 
rentielles (4) on entend leur mouvement et le terme « solution » se 
rapporte au choix de la loi régissant la variation des commandes dans 
le temps. 

Si on inclut dans la notion de l'état d'un système à un instant 
donné t* tout ce qui précédait la variation des coordonnées de phase 
du système dans l'intervalle de postaction 1* — T<<t<t*, le 
principe d'optimalité qui vient d’être énoncé sera également vrai 
pour les systèmes à postaction, c'est-à-dire régis par des équations 
aux différences. 

Pour les systèmes décrits par les équations différentielles (4) 
le principe d'optimalité coïncide avec le fait bien connu qu'une 
partie de trajectoire optimale est encore une trajectoire optimale. 

La figure 12.1 représente à titre d'exemple [85] la trajectoire 
optimale du système (4) qui passe par le point donné x (0), c'est-à- 
dire la trajectoire qui, sous la condition (7), minimise la fonctionnelle 
(8) où la grandeur T est supposée fixée. On suppose également que 


«= 


la valeur x (T) est inconnue à l’avance. Le point zx (£,) divise la 
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trajectoire étudiée en deux arcs Z et 2. L’arc 2 est associé à la fonc- 
tionnelle 


T 


O= | G(z(t), u(t)) dt. (12.9) 
ta 


L'arc 2 peut être considéré également comme une trajectoire indé- 
pendante qui sera optimale si elle minimise la fonctionnelle (9). 

Le principe d’optimalité dit que l'arc 2 de la trajectoire optimale 
1-2 est lui-même une trajectoire optimale du système (4), dont l'état 
pour { — #, est zx (4;). 

Si l’on admet le contraire, il existe (fig. 12.1) une autre trajectoire 
2" qui donne à la fonctionnelle (9) une valeur plus petite par rapport 
à la trajectoire 2. Mais la trajec- 
toire optimale dans l'intervalle de 
temps (0, T) sera 7-2”, et non pas 
1-2. On aboutit ainsi à une con- 
tradiction avec les données initia- 
les suivant lesquelles la trajectoire 
1-2 est optimale. Cette contradic- 
tion prouve que dans l'intervalle 
(41, T) l'arc 2 de la trajectoire opti- 

Fig. 12.1 male 7-2 est encore une trajectoi- 
re optimale du système (4). 

Notons maintenant que le principe d’optimalité concerne le 
mouvement du système qui succède à l’état donné. En général, pour 
un état antérieur à l’état donné il peut ne pas être vérifié. 

Ainsi, par exemple, si l’on ne se donne que l’état initial du 
système x (0), l’arc Z de la trajectoire optimale 7-2 peut ne pas être 
lui-même une trajectoire optimale, c'est-à-dire il se peut qu'il ne 
minimise pas la fonctionnelle 


Où = [ G(x(t), u(t)) dt. (12.10) 


( 


Ce n'est que lorsque le point final x (4,) de l’arc Z est donné que 
cet arc sera par lui-même une trajectoire optimale. 

Donc, dans le cas de systèmes de commande, le principe d'opti- 
malité dit que le choix de la commande optimale n'est défini que par 
l'état du système à l'instant courant. 

Cette affirmation permet d'obtenir les équations fonctionnelles 
données ci-dessous qui déterminent la loi de variation des commandes 
dans le problème de la commande optimale. 

La méthode de Bellman relative à la détermination de la com- 
mande optimale est intimement liée au problème variationnel de 
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propagation de l'excitation [24] et conduit aux équations aux dérivées 
partielles de Jacobi-Hamilton. 

Pour les systèmes discrets, la méthode de Bellman permet de 
déterminer les commandes en plusieurs étapes. 


$ 13. Application de la programmation dynamique 
aux systèmes discrets 


1. Relation de récurrence de Bellman. De nombreux systèmes 
de commande sont décrits par des équations aux différences finies. 
Ces systèmes portent généralement le nom de systèmes discrets. On 
range dans cette catégorie les systèmes impulsionnels, les systèmes 
munis de calculateurs digitaux, etc. 

Les systèmes décrits par des équations différentielles s'appellent 
en ce sens systèmes continus. 

A tout système d'équations différentielles on peut faire corres- 
pondre un système équivalent d'équations aux différences finies 
à variable continue [77]. A cet effet, il faut intégrer le système d’équa- 
tions différentielles donné dans l'intervalle de temps fini {,. + e < 
<it<tl, + e + T, où T est l'intervalle de discontinuité fixé et & 
(où O0 << 8 << +), le paramètre associé à un point situé à l’intérieur 
de l'intervalle de discontinuité. Les coefficients du système d’équa- 
tions aux différences finies dépendent de & et la solution de ce sys- 
tème d'équations définit, à tout instant £, l’état du système considéré. 

Le système d'équations aux différences finies ainsi obtenu cons- 
titue des équations fonctionnelles exactes qui associent entre eux 
les états du système aux instants séparés par l'intervalle de discon- 
tinuité +. 

Si l’on se borne à l’étude de l’état du système aux instants discrets 
séparés par des intervalles de discontinuité +, on peut alors fixer 
la valeur du paramètre & et obtenir ainsi un système d'équations 
aux différences finies à variable discrète. Sa solution détermine 
exactement l’état du système à des instants discrets séparés par la 
grandeur t = const. La position de ces instants dans l'intervalle de 
discontinuité est définie par le choix du paramètre e. 

La construction des équations aux différences finies mentionnées 
ci-dessus qui décrivent exactement le système de commande à 
action continue peut s'avérer très longue dans le cas des problèmes 
suffisamment complexes. 

Les équations aux différences finies approchées peuvent s'obtenir 
de la façon suivante. 

Supposons que le système de commande est régi par l'équation 
différentielle scalaire 


TEE) (13.2) 
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où x est la coordonnée du système et u, la commande qui doit vé- 
rifier la contrainte 


u E Q. (43.2) 
L'état initial du système est donné 
[z (é)}=o — Z (O), 


et il faut trouver la commande & = u (t) minimisant la fonctionnelle 
T 

Q= | GE, 2@)4+ GT). (13.3) 
0 


avec T7, une certaine grandeur fixée. Considérons que 
T = Nr, (13.4) 


où N est un nombre entier et t = const, une grandeur suffisamment 
petite que nous allons adopter comme intervalle de discontinuité. 
Bornons-nous ici à l'étude de l’état du système aux instants discrets 


tt (8 —0,1,2,..., N). (13.5) 
Comme 
de z(t+t)—2z(t) _ z(ÜT+T)—2z(Ôt) | 


l'équation différentielle initiale (1) peut être remplacée par la 
relation approchée suivante: 


z (OT + rt) — x (OT) = vf, (x (OT), u (8T)). (13.7) 


Le premier membre de (7) est la différence première de la fonction 
z (t); la relation (7) représente donc une équation aux différences 
finies par rapport à la fonction scalaire inconnue x (ô). 

La variable des fonctions z et 4 du second membre de (7) étant 
discrète, (7) est une équation aux différences finies à variable dis- 
crète et sa solution ne définit l’état du système qu'aux instants dis- 
crets t — Ôt (ÙŸ = 1, 2, ...). 

La fonctionnelle (3) est approximée par la somme intégrale 

N- 


1 
Q=7T À Gi (x (dt), u(t)) + (z (Nr). (13.8) 
En introduisant les notations 
z(8) = z(8t),  u(9) = u (ôr), (13.9) 
f (z (8), u (8)) — 8), u (6)), 
É KE (0): u (8) = 2 ( (8, u (8), Ge#e 


on aboutit, d’après (7), (2) et (8), au problème suivant. 
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Trouver pour un système décrit par l'équation scalaire aux dif- 
férences finies à variable discrète 


z(9 +1) = 2 (0) + f(z(), u (d)), (13.11) 
dont l’état initial est donné 
[x (0)lo=0 = Z (0), (13.12) 
la commande u = u (Ÿ) qui satisfait aux contraintes 
uE Q (13.13) 


et minimise la somme 


N -1 
Q= EG (0), u (8) + (&(N), (13.14) 


avec V, une grandeur fixée. 


Dans ce qui suit nous allons fonder l’étude des systèmes discrets sur les équa- 
tions de la forme (11)-(14) (en posant, dans le cas général, que x, u, f sont des 
vecteurs de dimension correspondante), sans plus parler du mode de leur obten- 
tion pour un système concret mais en considérant quand même que ces équations 
sont exactes (du fait que, dans le cas général, on peut obtenir des équations aux 
différences exactes de la forme (11)). 

L'erreur des solutions fournies par l’approximation (6) (donnée à titre 
d'illustration) des équations aux différences peut devenir importante et chaque 
fois le choix d’une telle approximation doit être justifié. Toutefois cette question 
exige des études spéciales et nous n'allons pas nous y attarder. 


Le problème posé ci-dessus décrit par les équations (11)-(14) 
consiste à chercher un ensemble des variables uw (0), u (1), u (2), ... 
..., U (N — 1) minimisant la somme (14) sous les conditions (11), 
(12) et (13). 

Pour le résoudre, commençons par le dernier intervalle de temps 
(N — 1)Tt<t< NT, en supposant connu l'état x (N — 1). D'après 
le principe d'optimalité, dans l'intervalle de temps (NW — 1) rt < 
< t< Nr la commande w doit être choisie compte tenu de la con- 
trainte (13) de façon à minimiser la somme partielle 


Ova = GEN—-ILu(N—1) +p(z(N)), (13.15) 


qui correspond à cet intervalle de temps. Etant donné que, d'après 


ZW) =z(N— 1) +f(&(N— 1) w(N—1)), (1346) 
l'expression (15) devient 


Qu = GUN —1), u(N —1)) + px (N — 1) + 
+f(z(N—A1) u(N —1))] (13.17) 
Puisque l'état x (NV — 1) est supposé connu, l'expression (17) ne 
dépend que d’une seule grandeur inconnue u (NW — 1) qu'il faut trou- 
ver en tenant compte de la contrainte (13) en minimisant la grandeur 
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Qw-- Désignons par u* (N — 1) la valeur optimale obtenue de 
u (N — 1). La valeur minimale Q,_, qu'on obtient alors est notée 
Sn . 

min Qn-: =S y, = Sy, (z (N —1)). (13.18) 

u(N -1)€Q 
(18) montre d’une façon explicite que la valeur minimale Q,., 
dépend de l’état du système zx (NM — 1). 
Conformément à (17) la relation (18) devient 
Sy (z(V—1)= min Qx= 
u(N—-1)€EQ9 

min {G(z(V—1), &(N—1))+p(z(N)1= 


u(N-1)EQ 


min {G(z(N—1), u(N—1))+p{z(N —1)+ 
u(N—1)EQ 


+f(z(N—1), u(N—1)}}. (13.19) 


Considérons maintenant l'intervalle de temps (N—2)t< t< 
< Nr+, composé du dernier et de l’avant-dernier intervalles. D’: après 
(14), à cet intervalle correspond la somme partielle 


Qu: = G(G&(N—2)u(N—2)+G(N —1);u (N —1)) + 


+ p(z(W)) (13.20) 
ou, en vertu de (15), 


Qn-2 = G(G(N — 2), u(N —2)) + Ov. (13.21) 


Supposons que l’état zx (N — 2) est connu. Le principe d’optima- 
lité entraîne que, dans l'intervalle [(N — 2) rx, N+t), ce ne sont que 
l'état x (N — 2) et le but de la commande (minimisation de Q x-2) 
qui déterminent la commande optimale. 

Cherchons maintenant S,., c’est-à-dire le minimum de Q,. 
par rapport à u (N — 2) et u (N — 1). Retenons que le minimum 
de la somme partielle Q,_, par rapport à u (N — 1) est déjà trouvé 
et que ce minimum 


S w-1 = Sn1(r (N — 1) 
figure sous la forme d’une fonction de z (N — 1). Comme d’après (11) 
Zz(N—1)=2z(N—2)+f(z(N — 2), u(N —2)), (13.22) 
Sn s'écrit 
Sa (T(N—1) = Sxalz(N—2)+f(&(N —2), u(N —2))]. 
(13.23) 


$ 13] APPLICATION AUX SYSTÈMES DISCRETS 207 


Puisque le premier terme du second membre de (21) ne dépend pas 
de u(N —1), on a 
S'y-2 (z (N — 2)) = min On = 

u(N—2)€Q 

u(N—1)EQ 


= min [G(z(N—2), u(N—2))+Sn4(r(N—1))] = 
u(N—2)EeQ 


_ nine {G(z(N—2), u(N—2))+ Sxs(z(N—2) + 
+f(&(N—2), u(N—2)]}. (13.24) 


Ainsi, l'expression (24) est ramenée à une forme qui n’impose la 
minimisation que par rapport à une seule variable, et notamment par 
rapport à u (N — 2). La valeur u (N — 2) ainsi obtenue est précisé- 
ment la valeur optimale recherchée que nous allons noter u* (N — 2). 

L'expression (24) montre que le choix de u (NW — 2) en n'im- 
posant la minimisation que du premier terme de (21), c'est-à-dire 
en n’appliquant le principe d’optimalité qu’à l'intervalle (N —2)1< 
<t<(N — 1)7, serait incorrect, ce que nous avons déjà dit en 
décrivant le principe d’optimalité. 

Considérons maintenant l'intervalle (N — 3) rt < t << Nr+, com- 
posé de trois derniers intervalles. D'après (14), à cet intervalle cor- 
respond la somme partielle 


Qnu-s = G(TIN—3), u(N—3) +G(z(N—2), u(N —2)) + 
+ GGN—-1,u(N—1)) + p(z(N)) (13.25) 

ou, en vertu de (13.20), 
Qnu-s = G(T(N —3), u (N —3)) + Qx-.. (13.26) 


L'état x (N — 3) est supposé connu. D'après le principe d'opti- 
malité, dans l'intervalle [(V — 3) rt, Nx), seuls l’état x (N — 3) 
et le but de la commande (minimisation de Q,._:) déterminent la 
commande optimale. 

Cherchons maintenant la grandeur S ; _., c'est-à-dire le minimum 
de Q y -, par rapport à u (N — 3), u (N — 2) et u (N — 1). Retenons 
que le minimum de la somme partielle Q ,_. par rapport à u (N — 2) 
et u (N — 1) est déjà trouvé (24) et que ce minimum 

Sw-2 = Sn-s (x (N — 2)) 


est présenté sous la forme d’une fonction de x (N — 2). Comme 
d’après (11) 
Zz(N—2)=2z(N—3)+f(r (N — 3), u(N —3)), (13.27) 
Sy-2 s'écrit 
Sn-sa (x (N — 2)) = Sx-2 (x (N — 3) + j (x (N — 3), u (N — 3))l. 
(13.28) 
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Comme le premier terme du second membre de (26) ne dépend pas 
deu(N—2)etu(N —1),ona 
Sn-3(T(N—5)= min 953 = 


uN—S8)E 
u(N—2)€0 
u(N—1)eQ 
— min [G(z(N—3), u(N—3))+ Sue (z(N—2))] = 
u(N—3)ER 
= min {G(z(N—3), u(N—3))+ 
u(N—3)}EQ 


+ Sn lr(N—3)+ f(x (N—3), u(N—3))]}. (13.29) 


L'expression (29) est réduite à une forme qui n’impose la minimisa- 
tion que par rapport à une seule variable, et notamment, par rapport 
à u (N — 3). La valeur de u (N — 3) ainsi trouvée est la valeur 
optimale recherchée que nous allons désigner par u* (MN — 3). 
En considérant l'intervalle (N — k)Tt7<t< Nt(k = 2,3,... 
.., N), on obtient sans peine la formule générale (de récurrence). 
D'une façon analogue à (24) et (29), on a 


Sn-n(z(N—k))= min Qva= min {G(z(N—k), u(N—k))+ 


PS 
| uN—1)e0 
+ Sin [rT(N—R)+ (TN), u(N—R))}  (k=2,3, ..., N). 


(13.30) 


L'expression (30) est réduite à une forme qui n’impose la minimisa- 
tion que par rapport à une seule variable, et notamment, par rapport 
à u (NV — k). La valeur de u (N — k) ainsi obtenue est la valeur 
optimale recherchée que nous allons noter u* (N — k). 

Ainsi, (19) et (30) donnent 


u*(N—1)=u(x(N—1)), 
u*(N—2)=u(z(N—2)), 
(13.31) 
u*(1)=u(x(1)), 
u*(0)=u(r(0).  } 

Les expressions (31) montrent clairement que les valeurs u* (W—j) 
obtenues par étude des intervalles de temps partiels [(N — j)r, 
NT) G =1,2,..., N) sont exprimées sous la forme de fonctions de 
l'état du système x (VW — j) au début de ces intervalles. 

L'état x (0) étant donné, on trouve la valeur u* (0). Puis d’après 


(11) on cherche l’état x (1) et détermine la valeur u* (1). Ensuite (11) 
permet d'obtenir l’état x (2) et calculer la valeur u* (2), etc. 


£ 13] APPLICATION AUX SYSTÈMES DISCRETS 209 


Ainsi, la méthode exposée permet de bien définir la commande 
optimale dans l’intervalle de temps donné (0, Mr). 

Dans l’algorithme de programmation dynamique du système (11) 
établi dans ce qui précède, le rôle essentiel revient à l'hypothèse 
que l'instant final du fonctionnement du système T = Nr est fixé. 
La construction de l'algorithme de programmation dynamique pour 
une valeur de 7 non fixée à l’avance, comme c'est le cas, par exemple, 
du problème de la réponse en temps minimal, est exposée dans ce qui 
suit. 

2. Systèmes discrets multivariables. L'algorithme de program- 
mation dynamique du système (11) peut également être appliqué à 
un système régi par une équation vectorielle aux différences finies 
ou un système d'équations scalaires aux différences finies 


Tj (Ô + 1) — Ÿ)j (Ô) a Î; (f (Ô), Zn (Ô), U; (6), °. .s Ur (Ô)) (13.32) 


G=1,...,n). 
Si l’on introduit les vecteurs 
Ti U, DACAU 
z=| ce. |, u=|l --. |, f(x u)=]|] :- -.. |, (13.33) 
Lis Ur _fn(x,u) 
où, pour condenser l'exposé, on désigne 
is 4) = fit s sat Un 25 W), 


on peut remplacer le système d'équations aux différences (32) par 
une équation aux différences vectorielle 


z (0 +1) = z (8) + f(x (0), u (8)). (13.34) 


Les fonctions Q, G et @ de l'expression (14) sont ici des fonctions 
scalaires des variables vectorielles x (8), u (8) (8 = 0,1,...,N — 1) 
et x (N). 

On voit aisément que si seulement par x, u et f on entend les 
vecteurs (33), les relations (19) et (30) gardent leur forme. 

La différence essentielle consiste pourtant dans le fait que l’ex- 
pression entre accolades du second membre de Îla relation (19) est 
maintenant une fonction de r variables scalaires uw, (N — 1), 
Ua (N — 1),...,u, (N — 1) et sa minimisation s'effectue par rap- 
port à toutes ces variables. D'une façon analogue, dans la relation 
(30) la minimisation doit se faire par rapport à r variables u, (N — k), 
Ua (N — k), ..., u, (N — k). 

La fonction scalaire 


Sx-; = Sx-; (x (N — j)) G =1,..., N) 


14—0393 
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est maintenant une fonction de la variable vectorielle x (NW — j). 
La commande optimale calculée à chaque étape (vecteur u* (MN — j)), 
est de même que dans (31) la fonction de l’état du système 


u*(N—j)=u(z(N — j) =1,..., N). (13.35) 


La fonction u (x (N — j)) est une fonction vectorielle de la variable 
vectorielle zx (NW — j). 


$ 14. Application de la programmation dynamique 
aux systèmes à action continue 


1. Problème à temps fixé et à extrémité de trajectoire libre. Con- 
sidérons le système commandé décrit par l’équation différentielle 
vectorielle 


dx 
7 =Î(z, U, L), (14.1) 
où x, u et / sont les vecteurs de la forme 
T! EE T us f1 (x, U, t) 
T — ... : U = . : f(x, U, l) = CC - (14.2) 
Ln._ Up fn (x, , t) 


L'état initial du système est donné 


[x (4)}=0 = x (0). (14.3) 
Chercher la commande u = u (t) qui vérifie les contraintes 
u € Q (14.4) 


et minimise la fonctionnelle 
T 
A RACONTONL 2 (14.5) 
0 


où 7 est une certaine grandeur fixée. 

Soit la trajectoire optimale du système (1) (fig. 14.1) qui passe 
par le point donné zx (0), c’est-à-dire une trajectoire minimisant sous 
la condition (4) la fonctionnelle (5). Dans le problème considéré, la 
valeur x (T) n’est pas donnée à l'avance. 

Désignons par S (x (0), 0) la valeur minimale de la fonctionnelle 
Q associée à la trajectoire optimale. 

La figure 14.1 indique les positions du point représentatif sur la 
trajectoire optimale aux instants t et {” — t + At. L'état du système 
à l'instant test x (1). L'état du système à l'instant {” = t + Ats’écrit 


z(t+ At) =zxt(t) = zx. (14.6) 
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Selon le principe d'optimalité l'arc de la trajectoire optimale 
depuis le point x (t) jusqu’au point x (T) est lui-même une trajectoire 
optimale qui minimise la fonctionnelle 


T 
Q= | G(zx, u, v) dv. (14.7) 
{ 


Désignons cette valeur minimale de (7) par S (x (t), t), ou, pour 
abréger l'écriture, par S (zx, t). 


D Don une 
_—_ 


5 


HS X(T) 


Fig. 14.1 


D'une façon analogue, l'arc de la trajectoire optimale depuis le 
point x (£”) (où {” = & + At) jusqu'au point zx (T) est également lui- 
mème une trajectoire optimale minimisant la fonctionnelle 

T 
0 | G{ru,vidv  (#'=t+A). (14.8) 
, 
Introduisons les notations de la valeur minimale de la fonctionnel- 


le (S) 
S(z(t+ At, t+ At =S (x, t). (14.9) 
Suivant la définition adoptée plus haut, 
T 
S(r,t)= min fe& 0), u (v), v) dv. (14.10) 
u(v)eQ ! 


Compte tenu de la petitesse de At, l'intégrale du second membre de 
l'expression (10) peut être mise sous la forme 


T t=1-+At 
\ G(rz(v), u(v), v)dv=— | G(xz(v), u(v), v) dv + 
{ À { 
Fe | G{z(v,u(r), v)dv=G(z(t), u(é), 1) A+ 
1’—t+4t 


T 
Lo, (At) + | G(z(vu(v), v)dv, (14.11) 


14° 
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où l’on suppose que la fonction w (v) est continue dans l'intervalle 
semi-ouvert [£, t + At). L'expression (10) devient 


S(x,t)= min {[G(x(t).u(t),t) At+ 
u(t)EQ 


T 
+ min | G(z(v),u(v), v)dv]+ai(At). (14.12) 
u(v)En », 


Le premier terme entre crochets de (12) ne dépend que de la valeur 
de la commande u à l'instant t, c’est-à-dire de uw (t). Le deuxième 
terme entre crochets doit être minimisé par rapport à l’ensemble des 
commandes admissibles uw (v) dans l’intervalle de temps t <v<T. 
Cette valeur minimale, que nous allons noter S (x, {’), est à son 
tour fonction de l’état du système zx’ — zx ({”). Quant à ce dernier, il 
dépend de la commande w dans l'intervalle (£, £ + At) ou, à 0, (At) 
près, de la valeur w (t) à l'instant £. En effet, en choisissant les diffé- 
rentes valeurs de la commande w à l'instant t on obtient un faisceau 
de trajectoires issu du point x (t) de la trajectoire optimale ; à l'instant 
t’ le point de phase occupe sur chacune de ces trajectoires une certaine 
position x(t’). En choisissant u (v), {<< v<T, telle qu’elle 
| T 


minimise la fonctionnelle Q,. — je (x (v), u (v), v) dv, on définit 


| ’ | 
le prolongement de chacune des trajectoires du faisceau concerné 


(fig. 14.1). Nous avons déjà dit que les valeurs min @,: = 


u (v)EQ 
T 


= min \ G(z(v), u(v), v) dv dépendent de la valeur de la 
u(vxQn 

commande w à l'instant £, c'est-à-dire qu'elles seront différentes pour 

toute trajectoire du faisceau considéré. Voici à o (At) près les valeurs 

Qt de la fonctionnelle Q, sur chacune de ces trajectoires: 


T 


Qr =Qi(u(t))=G(z(E), u(?). 1) At+ nu | Gt), u (v), v) dv. 


La valeur u (t) qui minimise la fonction Q* (u (t)) détermine la 
trajectoire optimale. Il en résulte que dans la relation (12) la mi- 
nimisation par rapport à u ({) porte sur toute l'expression entre 
crochets et non seulement sur son premier terme. 

En tenant compte de la notation adoptée 


T 
S(x',t)= min | G(z(v). u(v), vdv, (14.13) 
0 7 utven à 
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récrivons la relation (12) 
S(xz,t)= min {[G(z(t),u(t),t) At+S(x", t’}]+o1 (At). (14.14) 
u(t)EN 


On voit aisément que la relation (14) entre S (zx, t) et S (z’, t’) peut s'ob- 
tenir également à partir de (13.30) si l’on tient compte du fait qu'ici aux instants 
(N —k)zx et (N —k+1)T correspondent les instants t et t” = t + At. 
Remarquons de plus que la fonction sous le signe somme de la fonctionnelle (13.3) 
a été désignée par G}, alors que d'après (13.10), la fonction G de l'expression (13.30) 
s'écrit G = TG,. C'est pourquoi, conformément à (5), il faut remplacer la fonc- 
tion G(z(N — k), u (N — k)) de l'expression (13.30) par la fonction G (x (t), 
u(t), t) At= Gi(z, u, t) At. 

De cette façon, la relation de récurrence (13.30) est remplacée par la relation 


S (x, t) = HAE (z(t), ut), t)At+S (x’, t)] + os (At), 


où 0, (At) est un infiniment petit d'ordre supérieur à une grandeur de At. Cette 
grandeur est ajoutée parce que pour déduire la relation (13.30), nous sommes par- 
tis de l'équation aux différences (13.7) obtenue à l’aide de la relation approchée 
(13.6) entachée d’une erreur d'ordre o, (t). L'accroissement de la variable + 
de (13.6) est remplacé ici par At. 


Notons que d'après (1) 


'=z(t+A)=r()+ At + 04 (At) = 


= z(t)+f(z(t),u(t), t) Attoa(At). (14.15) 


Supposons maintenant que la fonction $ est continue et qu'elle 
possède partout des dérivées partielles continues par rapport à 
toutes ses variables 


as 


6. 
Ôx; ot 


(i=1,...,n), —. 


Cette hypothèse est très importante du fait qu’elle n’est pas vraie 
pour de nombreux problèmes pour lesquels les raisonnements qui sui- 
vent nécessitent une justification supplémentaire [14]. 

Dans cette hypothèse, on a en vertu de (15) 


S(z',t)=S(x(t+ At), t+ Ar) = 
= S(x(t)+f(z(#), u(t), 1) At+os (At), t+At)= 


—S(x,9+ 5 PEN (ou, D A+ Art os (A. (14.16) 
i=1 


Z; { 


Si l'on désigne par 


S 
grad S, = ht fete. + fm (4417) 
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le produit scalaire des vecteurs 


9S 

Ôz: Î1 (x, U, t) 
grad S = | : | flau: Del +: 21: | 

0 

EM În (x, U, t) 


l'expression (16) peut s'écrire 
S(z',t')=S(r,t)+(gradS(x,t), f(x, u. t)) At+ 

+ ED A+ 0 (AD. (14.18) 
Portons l'expression (18) dans la relation (14) pour obtenir 
S(x,t) = us [G(z,u,t)At+ES (x, à) + 


+(grad S (x, 4), fes u, 0) At+ ED À + 03 (AP)] +01 (At). (14.19) 


D'après (10) la fonction S (x, t) s’obtient par minimisation de la 
T 
fonctionnelle | G(x (v), u (v), v) dv par rapport à x dans l’inter- 


t 
valle £<Lv<T, c'est-à-dire la fonction S$ (x, t) ne contient déjà 
plus de u. C'est pourquoi il est possible de faire sortir du signe 
min les termes S (x,t) et FC À entre crochets de (19) et mettre 


l'expression (19) sous la forme 
S(r,t)=S (x, t)+ At + min [G(z,u,t)At+ 
uE 
+ {(gradS (x, !), f(r, u, t)) At +03 (At)] + 0, (At), 


ou 
— C9 - min [G(z,u,t)+{(grad S(x,t), f(x, u,t))] + #00 R 
ucQ 
(14.20) 
Comme lim 209 Lo, en passant dans (20) à la limite pour At +0, 
At+0 
on obtient. 
. OS (x, t) 


= min [G(z,u,t)+(grad S(x,t), f(x, u,t))]. (14.21) 
u€ 


L'équation (21) [9] s'appelle équation de Bellman. 

Puisque la minimisation par rapport à u de l'expression entre cro- 
chets fait éliminer u du second membre de (21), l'équation (21) sera une 
équation aux dérivées partielles non linéaire du premier ordre du 
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type de Jacobi-Hamilton. La fonction uw qui minimise l’expression 
entre crochets de (21) est la commande optimale cherchée u*. Cette 
fonction dépend pourtant de grad S (zx, t). Ce n’est qu’en résolvant 
l'équation aux dérivées partielles (21), déjà minimisée par rapport à 
u, qu'on obtient grad S (x, {) sous une forme explicite, et par suite, 
la forme explicite de la commande optimale u*. 

Voici les conditions aux limites de l'équation (21): pour la fonc- 
tionnelle (5), S (x (T), T) = 0; pour la fonctionnelle (13.3), 
S (z(T), T) = p (x (7)). 

Soulignons maintenant que pour déduire l’équation (21) le point 
de départ était la trajectoire optimale déjà trouvée du système (1). 
Dans l'hypothèse de la fonction S (zx,.t) lisse, l’équation (21) a lieu 
pour toute trajectoire optimale. Ainsi, sous cette hypothèse, l’équa- 
tion de Bellman donne les conditions nécessaires d'optimalité. La 
question de la suffisance de ces conditions demande une étude spéciale. 


Exemple 1. Considérons le système décrit par les équations [85]: 


dr; 

ur re 
Te 

dt 


Supposons que la fonction sous le signe somme de la fonctionnelle (5) s'écrit 
G—= G(xy, za t). 
Dans notre exemple, (1) entraîne 


fh\(z u)= ur + 2, 


Îe (z, u) — u°. 
Ici l’équation de Bellman (21) est de la forme 


er dl (Zi, To, u), 
où 
0S 


A (zys To, U)=G (ray, te, t)+ FER 


2 , 
(ur + 2e) + 72 u*, 
Comme 

dK OS 0S d°'K 0S 


—— =—— 1 —u, =) 
du CET + ÛZs © du ÜTo ? 


D] 0S L] L 2 
dans le cas Où —— > 0, la fonction X aura son minimum pour u = u*, avec 
a 
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La valeur minimale de [X (z,, z2, u)],_., devient 
min A (ri ze u)= K (rs, re, u*)—G (x, ze, t)+ 
u 


28, 1 st | 0S le 1 
ei Ôz: 2 à 0x; 0S l 
UE LS 


Ainsi, dans l'exemple considéré, l'équation de Bellman (21) se met sous la forme 


EN) CA) 4 , [05 \? 1 
y Gerettae-ra(se) =. 


ÔTo 


E xemple 2. Dans l'exemple précédent la commande n’était pas li- 
mitée par des contraintes. Considérons maintenant le système décrit par les 
équations 


dr 

“ =UTit ze, 
LE 

dt 


Supposons que la fonction sous le signe somme de la fonctionnelle (5) est 
G= G (x, za, t). 


= Uo. 
- 


Imposons aux commandes u,, u, les contraintes 
—1<u <1 (i = 1, 2). 
D'après (1)on a 
hi (zu) = ur + 2, 
Ja (Z U) = ua. 


L'équation de Bellman (21) devient 
DT n min Â(zy, to, U), 
où 
; 0S OS 
K (ti9 Ze, U)=G(z4, 2e, + (uizit re) + ue. 


La commande optimale u* qui minimise la fonction À (zx1, z2, u) s'écrit 


| à S 
u? = —sign (2: | ;. UT—= sign 


Ôr; 
Ainsi, sous les contraintes [u;|<1 (i—1, 2) imposées à la commande, 
la valeur minimale de [X (z1, ze, u)],_,,, est de la forme 


9S 0S 0S 
[Æ (æ1, zou) ue = G (Zi za t)—|7; En + Te de lol: 
L'équation de Bellman (21) est ici 
0S GAY 0S 2S 
— 7 = Gr ze, [1 HA FFT vs | 
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Remarquons que sous les contraintes — 1 < uy < 1 (i — 1, 2) imposées 
à la commande, la fonction S (x,, z+, t) n'est pas partout lisse (cf. ci-dessous 
$ 15). L'équation de Bellman obtenue dans ce dernier exemple ne doit donc 
être envisagée que dans le domaine où la fonction S est continue et possède des 
dérivées partielles continues par rapport à toutes ses variables. 


2. Problème à extrémité de trajectoire fixe et à temps libre. Ame- 
ner le système de commande régi par les équations différentielles 


dx è 
= fifi ce, Emo cs Ur) (=, ..., 2) (14.22) 
auxquelles est équivalente l'équation vectorielle 
dx 
= f(x, u), (14.23) 


où x, u et f sont des vecteurs de la forme 


x mé” fi (x, u) 
T= …. , u = Fe 9 f(x, u) = : ; 
Th ni dE Ur _ÏÎn(& u) 


du point zx (£,) = 1° de l’espace de phase X au point donné z*. L’ins- 
tant £, lorsque le point représentatif tombe en xz* n'est pas fixé à 
l'avance. 

La commande u = u (t) doit vérifier la condition 


u € Q, | (14.24) 


et elle doit être choisie de façon que la fonctionnelle 
Î1 


Q= | G{z(v), u(v))dv (14.25) 


soit minimisée. 

Admettons que la commande qui satisfait à ces conditions, la 
trajectoire qui lui correspond et l'intervalle de temps £, — ?, sont 
optimaux. 

La plus petite valeur possible de ® de la fonctionnelle Q obtenue 
sous ces conditions est une fonction de l’état initial x° du système 


D—=D(r) = Dix, 2°, ..., x). (14.26) 


Sous l’hypothèse que la fonction © est continue et possède partout 
des dérivées partielles continues par rapport à toutes ses variables, 
on peut obtenir une équation aux dérivées partielles (équation de 
Bellman) vérifiée par cette fonction. 

Par définition 


ls 
D(2)=D (7 (t))= min | G{z(v),u(v))dv. (14.27) 
u(v)£ 20 
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L'intégrale du second membre de (27) peut s’écrire 


! tot+At 
| &t(), u (v)) dv — Î G(z(v), u (v)) dv + 
to Lo 
ti 
+ | G(z(v),u(v)dv. (14.28) 
to+At 


Pour de petites valeurs de At, l'expression (28) peut être mise sous 
la forme 


{1 
| G(z(v), u(v) dv = G(z (to). u (to) At+ 


{1 


+o(A)+ | G(x(vu(v)dv, (14.29) 


to+At 


où l’on suppose que la fonction w (t) est continue dans l'intervalle 
semi-ouvert [t,, to + At). L’expression (27) devient 


D(x)= min | G(z(#0), u (4)) A+ 
u({o)ER 


{1 


min | Gtztv u(v) dv] +0, (49. (14.30) 


u(v)EQ fo+aAt 


La présence du signe min devant les crochets de (30) est justifiée 
par les mêmes raisonnements que ceux qui ont été donnés pour déduire 
la relation (12). 

Le deuxième terme entre crochets de (30) est ® (x (ft, + At)) et 
cette expression peut s'écrire 


D (x (0))= min (6 (& (0), u ()) A+ D (x (to + A1))1 +02 (A). (14.31) 
Puisque d'apres (23) 
z (to + At) = x (to) + (S),.,4t+0s (A!) = 


= TZ (to) + f (x (lo); 172 (lo)) At + 03 (At), (14.32) 
l'hypothèse suivant laquelle la fonction ® (zx°) est lisse, conduit à 


D (x (do + At)) = O (x (to)) + 


+ D EE 


f(x (to): u(to)) At+o, (At). (14.33) 


| 
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Portons maintenant l'expression (33) dans (31). Si l’on tient compte 
du fait que la fonction ® (x ({,)), résultant de la minimisation de la 
fonctionnelle (25), ne contient plus de u, ® (zx (t,)) de (31) peut être 
sortie du signe min. Il vient alors 


nl À G(z (to); u (to)) At+ 


u(to) 


+2 [ SE LE. fi (& (to, u (to)) at} + o(At)=0. (14.34) 


ii 


On peut adopter comme état initial tout état courant zx (t) et 
récrire respectivement la relation (34) ‘ 


si [G(, u) + > a, Sa fi (x, u) | +2 °(t) _o, (14.35) 


Puisque lim 0 0 en passant dans (35) à la limite pour At+0, 
At-0 


on obtient 


min [G(z, u)+ 3 a fitz,u)]=0. (14.36) 


L’'équation (36) est précisément Pile de Bellman relative au 
problème étudié à extrémité de trajectoire fixe et à temps libre. 
La solution de l'équation (36) doit satisfaire à la condition aux 
limites 
D'(at, 25, 54 2) = 0. 


3. Problème de la réponse en temps minimal.' Parmi les pro- 
blèmes dans lesquels l'instant £, où le processus de commande prend fin 


n'est pas fixé à l'avance, il y a également celui de la réponse en temps 
minimal. 

Considérons le système décrit par l'équation différentielle vec- 
torielle 


= f(x, u), (14.37) 
où z, u et f sont des vecteurs de la forme 
TRE U | f(x u) 
ZT = .. . u = .. À, f(x, u) = PTS 
LT Ur _Ja(tu) 


Les commandes u; sont soumises aux contraintes 
u E Q, (14.38) 
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qui, en particulier, peuvent s’écrire 
M LU LM, (GG = 1,...,7r). (14.39) 


Chercher la commande optimale u € @ qui er temps minimal T 
recale le système de l’état initial x (4,) = x° à l’état x (£,) = x (to-+ 
ie T) = 0, c’est-à-dire à l’origine des coordonnées de l’espace de 
phase. 

Le temps minimal T7 nécessaire pour que la commande u € @ 
ramè ne le système du point x ({,) = x° au point xt, + T) = 0, 
est fonction de l'état initial du système 


T=T()=T (2 ..., 2), (14.40) 


ct le problème de la réponse en temps minimal est un cas particulier 
du problème, étudié au point 2, qui consiste à minimiser la fonc- 
tionnelle (25) 


ti 
Q = | G(z(v), u(v)) dv. 


En effet, en posant 
G(z(t},u(t)) = 1, (14.41) 


on trouve que la fonctionnelle Q est le temps nécessaire pour recaler 
le système de l'état initial x (£,) = 2° à l'état x (4) = 0: 


Q=ti—to; (14.42) 
par conséquent, 
T= minQ— rs (1 — to). (14.43) 
u£cQ 


Si l’on tient compte du fait que pour l'état initial on peut prendre 
tout état courant z (t) et si l’on suppose que la fonction T (x,, +, . .. 
. + Zn) Soit continue et possède partout des dérivées partielles con- 
tinues par rapport à toutes ses variables, on obtient d’après (36) 
et (41) l'équation différentielle aux dérivées partielles du premier 
ordre vérifiée par la fonction T (x,, ..., r,): 


ma 1[S fi (z, u) | = — 
1=1 
ou 
min {(grad 7, f(x, u)}] = —1. (14.44} 
ucQ 
L’équation (44) constitue précisément l'équation de Bellman du 
problème de la réponse en temps minimal. 


La minimisation par rapport à w de l'expression entre crochets 
du premier membre de (44) sous la condition (38) permet de définir 
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la commande optimale u* qui‘figure sous la forme de la fonction de 
ps (i=1,...,n). En portant dans (44) cette valeur u* on obtient 


une équation aux dérivées partielles ne contenant pas de u. La 
solution de cette équation doit satisfaire à la condition aux limites 


T (0,0,..., 0) = 0. (14.45) 


Si l’on réussit à la résoudre, on détermine par là la commande opti- 
male u* — u* (x) sous la forme d'une fonction explicite de coordon- 
nées de phase du système. 

Malheureusement jusqu’à présent l'équation (44) n’a été résolue 
sous une forme fermée que pour les cas les plus simples. 


Exemple. Considérons à titre d'exemple le problème de la réponse en 
Le minimal d'un système linéaire décrit par les équations différentielles 
scalaires 


21 5 nat D Bjur (j=1, ...,n), (14.46) 
Rk=1 l=1 


où les commandes u, sont soumises aux contraintes 


—m<U LM (=1, ...,r). (14.47) 
Au système (46) est équivalente l'équation différentielle vectorielle 
= Ar+ Bu, (14.48) 
où 
s= |". | an 4 , Dr , [| (14.49) 
Zn Ac de Bis Be u, 


Conformément à (37) dans l'exemple considéré 


fm u)= À Ant Ÿ S ; Bus U=i,...,n), (14.50) 
E 


et l'équation de Bellman devient 


uen [22 Ôzj (> Ajntr + D) Bnut) |= — 1. (14.51) 


L'équation (51) peut ee. 


“ee D 52 KZ AjRT +2 (3) Je (14.52) 
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Sous les contraintes (47), l'expression entre crochets du premier membre 
de (52) est minimisée par les commandes 
n 
: OT 
Uy= — my Sign > de; D (l=1, ..., Pr). (14.53) 
=! 
Pour les commandes (53) l'équation de Bellman (52) se met sous la forme 


n n )T r n aT 
C 
> >, Ge Anh — D) > 3, Phi 
j—1 k=1 I=1 j=i 
Nous avons obtenu l'équation différentielle aux dérivées partielles non linéaire 


du premier ordre (54) ne contenant pas de u, dont la solution doit satisfaire 
aux conditions aux limites 


T (0, 0,..., 0) = 0. (14.55) 
L'équation de Bellman (54) que nous venons d'obtenir doit être étudiée 


dans le domaine où la fonction 7 est continue et où elle possède des dérivées 
partielles continues par rapport à toutes ses variables. 


m= —1. (14.54) 


$ 15. Conditions suffisantes d’optimalité 
et justification de la méthode de programmation dynamique 
pour les systèmes continus 


La méthode de programmation dynamique est bien justifiée pour 
des systèmes régis par les équations aux différences finies. 

Pour des systèmes décrits par les équations différentielles ordi- 
naires (c’est-à-dire pour des systèmes continus), la justification 
correcte de la méthode de programmation dynamique nécessiterait 
la démonstration de l’existence de la fonction lisse ® = © (2,,... 

. + Zn) définie par une équation non linéaire aux dérivées partielles 
(14.36) qui est l'équation de Bellman (il en est de même de la fonc- 
tion 7 (x) définie par (14.44)), du fait que pour déduire cette équation 
nous avons supposé que la fonction ® est continue et possède partout 
des dérivées partielles continues par rapport à toutes ses variables. 
Cette restriction ne résulte pas de la position du problème et cons- 
titue une contrainte qui, toutefois, n'est pas respectée dans de 
nombreux problèmes, même simples, dans lesquels [15} la fonction 
® (x, ..., z,) n'est pas lisse. 

Le problème de justification de la méthode de programmation 
dynamique pour des systèmes à action continue a été résolu par 
V. Boltianski dans ses travaux [14] à l'exposé desquels nous allons 
passer. 

1. Position du problème. Interprétation géométrique de l’équa- 
tion de Bellman dans le problème de la réponse en temps minimal. 
Considérons le système commandé décrit par les équations diffé- 
rentielles scalaires 


d : 
= f;(2 .….. Tn) Li; .…..) Ur) (j=1, PARA n). (15.1) 
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Ce système peut s'écrire sous ‘une forme vectorielle 
dz 
— = f(x, u), (15.2) 


où zx, u et f sont les vecteurs 


T1 Ui fi (x, u) _ 
z=|l --- |, =| ce |, f(au)=| -... |. (15.3) 
An. Ur fn (x, u) _ 
La commande u est soumise aux contraintes 
u € Q. (15.4) 


Considérons le problème de la réponse en temps minimal qui 
consiste à chercher la commande optimale u € Q, c'est-à-dire celle 
qui ramène le système de l’état initial x (t) à l'état x (t + T) — 0 
en un temps minimal 7. 

L'état final du système est x (t + T), c’est-à-dire le point de 
l'espace de phase en lequel le système doit être amené est fixé: 
z(t+ T) = 0. Commeétat initial nous adoptons un état quelconque, 
c'est-à-dire n'importe quel point x de l’espace de phase X. 

Le temps minimal T nécessaire à la commande uw vérifiant la 
condition u € @ pour amener le système du point z(f) au point 
z(t+ T) = 0 est fonction de l'état initial zx: 


FT = TE, :::, 2). 


Nous avons montré au $ 14 en supposant que la fonction T (zx,.. 


., Zn) est continue et possède partout (sauf au point final x — — 0) 
OT OT OT 
ee dérivées partielles continues PE SEA que cette fonction 


vérifie l'équation aux dérivées partielles (14. 44) 


min | S DA li(z, u) | — — À, 


u£n 


La commande qui minimise l'expression entre crochets est optimale, 
nous l’avons désignée par u*. 

Dans ce qui suit au lieu de T (x) il est plus commode d'utiliser 
la fonction w (x) qui ne diffère de T (x) que par le signe 


© (zx) = —T (2). (15.5) 
La relation (14.44) entraîne 


max [— x TA fi (x, u) | =1. (15.6) 


u£Q 
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Compte tenu de (5), la relation (6) peut s’écrire 


max| S SE fi(x, u) | = 1. (15.7) 


u£Q Ps 


La fonction w (x) est définie dans l'espace de phase X tout entier. 
En vertu des hypothèses qui ont permis d'obtenir la relation (14.44), 
la relation (7) a lieu sous l'hypothèse que la fonction w (x) est con- 
tinue et possède partout (sauf au point final x — 0) des dérivées par- 


; (4) 00 0w 
tielles continues Er La relation (7) est une équation 


de Bellman pour le Te de la réponse en temps minimal. 

Pour toute commande de l’ensemble des commandes limitées par 
la condition u € Q (y compris la commande optimale) qui recalent 
le système du point x au point x = 0, on a, conformément à (7), 
la relation 


> ne fi(x u)<T (ue). (15.8) 


i={ 


Comme z = xt), u = u (t), la relation 


D ED f(x, u (D) =1 (15.9) 


0 
4 


est observée pendant toute la durée du mouvement pour chaque 
trajectoire optimale, c’est-à-dire pendant toute la durée de passage 
du point initial z au point final z = 0. 

Voici l’interprétation géométrique qu'on peut donner à l’équation 
de Bellman dans le problème de la réponse en temps minimal. 
Puisque d’après (1) 


hi u)= TE, (15.10) 
l'équation de Bellman (14.44) peut s’écrire 
[RG ant. dE) _ 
min LE ra [eme 1, (15.11) 


c'est-à-dire lorsqu'on se déplace suivant la trajectoire du mouvement 
optimale, l'intervalle de temps qui reste pour atteindre l’origine 


des coordonnées diminue de façon que — T = = 1. 
D'après (11) 


min [ égrad T, + ]=—1. (15.12) 
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L'expression entre crochets est le produit scalaire du vecteur gradient 
de la fonction T (x) par le vecteur vitesse de phase du point repré- 
sentatif. 

Imaginons une famille de surfaces T (z) = const. On peut les 
appeler surfaces isochrones du fait que le temps minimal nécessaire 
pour atteindre l’origine à partir d’un point quelconque de la surface 
T (x) = C'est égal à la constante C. Au point x, le vecteur grad T 
est dirigé suivant la normale à la surface T (x) — const qui passe 
par ce point. La relation (12) montre que pour la commande optimale 


u = u* la projection de la vitesse de phase _ sur la direction 


négative de la normale à la surface T (x) — const, qui passe par le 
point x, est à tout instant positive, c'est-à-dire le point représentatif 
se déplace toujours dans le sens des valeurs décroissantes de T (zx). 

L'hypothèse sur l'existence des dérivées pause continues 


- = (i = 1,...,n) en tout point x équivaut à l'hypothèse sur les 


te lisses T (x) — const, c’est-à-dire sur l’unicité de la normale 
en tout point de ces surfaces. Les points où les dérivées partielles 


T E (i=1,...,n) n'existent pas sont des points singuliers des sur- 


É T (x) = const, et en ces points la direction de la normale à la 
surface T (x) — const n'est pas définie. 

2. Condition suffisante d'optimalité du problème de la réponse 
en temps minimal. Passons à la recherche des conditions suffisantes 
d'optimalité. La méthode proposée par V. Boltianski consiste à 
étudier la fonction w (x) d’un autre point de vue et en particulier, 
à choisir comme point de départ la relation (8). Cette relation permet 
d'apprécier le temps nécessaire pour qu’un système passe d’un état 
initial quelconque en un état final donné. Admettons de plus que les 
seconds membres des équations différentielles (1) sont définies, 


continues et possèdent des dérivées continues Sen tout point 
zE X quand u € Q. 
Lemme 1. Supposons donnée sur un ensemble ouvert D de l’espace 
X une fonction continue et continüment dérivable w (x) = © (x, ze, … 
., Tn) telle que pour tout x E D, u € Q, elle vérifie l'inégalité de la 
forme (8) 


ETS 


> DE); (2, (15.13) 


Alors, si u (t) (t Lt Lt) est une commande admissible (c'est-à-dire 
si u (t) € ) qui ramène le point représentatif de la position 1° en 
position zx*, la trajectoire correspondante x (t) reposant tout entière 
dans l’ensemble D, le temps t, — t, de passage de 2° en x* est évalué 


15—0393 
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par l'inégalité 
4 — to > © (x*) — © (x). (15.14) 


Démonstration. Soient T, Te, ..., T, les points de 
discontinuité des commandes w (t); en outre 


LL UT ee TR Le 
Introduisons encore les notations 
Lo = To li = Th+i 


Les points de discontinuité des commandes ont en général lieu 
si, par exemple, les contraintes (4) imposées à la commande sont 
de la forme 

M LU LM: ET: 0) 


Dans chaque intervalle (to, T1), (ti, Te), . . ., (Tr, Th+1) la 
fonction uw (t) est continue. 
D'après (8) et (1), 


: à t és à t)) ox (t d 

S 270 ) fi (x (), u (t))= D] En ) 2410 _ 2€ (t)) «1. (15.15) 
i=1 i= 
A l'intérieur de chaque intervalle (t;, t;41) (à = 0, 1, ..., k) la 
fonction w (x (t)) est continue et possède, en vertu de la condition du 
lemme, une dérivée continue par rapport à {, qui vérifie l'inégalité 
(15) 


do (x (t)) 
EI «1. 


Il en résulte que 
© (t (tit) — © (x (ti) < Tin — ( = 0,1, ...,k). 
En additionnant les premiers et les seconds membres de ces relations 
écrites pour les intervalles (t;, T;+1) (è = 0, 1, ..., k), on a 
© (x (Tr+1)) — © (x (To)) < Tati — To 


ce qui coïncide avec la relation (14). Ainsi le lemme est démontré. 
L'’adjonction d’une constante à la fonction «© (x) ne modifiant 
pas la relation (8), on peut poser que la fonction w (x) observe la 

condition | 
wo (z*) = 0, (15.16) 


ce qui correspond à la condition aux limites (14.45). 
Dans ces conditions l'inégalité (14) devient 


h—t4>—0 (x). (45.17) 
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Notons que l'équation (7),-qui est une équation de Bellman du 
problème de la réponse en temps minimal, a été obtenue précédem- 
ment comme la condition nécessaire d'optimalité. 

Nous avons démontré ci-dessus sous les mêmes hypothèses de 
continuité et de dérivabilité continue de la fonction w (x) et sous la con- 
dition w (z*) = 0, que si la relation (8) a lieu, la commande qui ramène 
le système de 2° en z* en un temps — (x°) est optimale. Il s'ensuit 
de (17) que cette transition ne peut être réalisée plus vite. Nous avons 
démontré donc que la relation (7) est une condition suffisante d'op- 
timalité. 

Ainsi dans le cas où © (x) est une fonction continue et continü- 
ment dérivable, l’équation de Bellman (7) est la condition nécessaire 
et suffisante d'optimalité. 

Nous avons déjà dit que dans de nombreux problèmes la restriction imposant 
la fonction w (z) continüment dérivable n'était pas respectée. Considérons à 


T 


um=-{ 


T' 


Fig. 15.1 


titre d'exemple d'un tel problème celui de la construction des commandes à 
temps optimal dans le cas d’un système régi par les équations 


ou 
dt si 
dre 

dd 


où la commande admissible est limitée par la contrainte 
—1<u<dî. 
On peut montrer (cf. p. 273) que l'arc 40 (fig. 15.1) de la parabole r, = rs 


et l'arc OB de la parabole z, = + z3 sont leslignes de commutation de la com- 


mande optimale. Au-dessus de la ligne AOB la commande doit être u = —1. 
Le point représentatif suit l’arc L;4,; de la parabole x, — —— zi+c;. Le point 


15° 
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A; de l'intersection de cette parabole avec la ligne AO est celui de la commuta- 
tion de la commande qui devient u — 1. Le mouvement ultérieur s'effectue sui- 
vant la ligne 4,0 jusqu'à l’origine des coordonnées. 

Au-dessous de la ligne AOB il faut poser u = 1. Le point représentatif se 


déplace suivant l'arc A;,B; de la parabole z, me z5+ c;. Le point B,; de l’inter- 


section de cette parabole avec la courbe B0 est celui de la commutation de la 
commande qui devient u — —1. Le mouvement se poursuit suivant la ligne B,0 
jusqu’à l’origine des coordonnées. 

La trajectoire L;A;0 et la trajectoire A,B,0 sont des trajectoires parcourues 
en un temps minimal du point représentatif dont les positions initiales reposent 
sur les lignes L;4; et X;,B; respectivement. 

Nous montrons ci-dessous (p. 277) que la fonction © (x) = — T (x) as 
00 (zx 


continue dans le plan de phase zr;r, tout entier. Les dérivées partielles = 
! 


0 (r) 
Oxo 


et existent en tout point du plan de phase z,7,, sauf les points de la ligne 


2 ct 0w(z) 


de commutation 40. Les dérivées partielles ae = n'existent en aucun 
1 2 


point de la ligne de commutation AOB. 


Supposons dans le cas général que nous avons découpé dans l’en- 
semble D sur lequel est donnée la fonction w (x) un ensemble M 
(« ensemble singulier » de la fonction w (x)), que la fonction « (x) 
est continue sur l’ensemble D tout entier et qu’elle ne possède des 
Ati) (="1 n) qu'aux points de 
0 ».. N)q X P 
l’ensemble D qui n’appartiennent pas à M. 

Lemme 2. Soit D un ensemble ouvert de l’espace de phase X 
et M un certain ensemble contenu dans D. Supposons donnée sur l'en- 
semble D une fonction continue w (x) = w© (x;, Ts, - - ., T,) possédant 
en dehors de M des dérivées partielles continues et vérifiant l'inégalité (8) 


dérivées partielles continues 


: à 
D RL fie, u)<1. 


=! 


Soit, ensuite, u (t) (tb) Lt L t1) la commande admissible qui ramène 
le point représentatif de la position x° en position x* ; de plus, la tra- 
jectoire correspondante x (t) se trouve tout entière dans D et ne coupe 
l’ensemble M qu'en un nombre fini d’instants. Alors, le critère (14) 


th — t > © (x*) — © (2°) 

est encore vrai. 

Démonstration. 

1°. Remarquons que le critère (14) est encore vrai si la trajectoire 
x (t) ne coupe l’ensemble M qu'aux instants t,, {, ou à l’un de ces 
instants. En effet, c’est le cas qui correspond complètement à la 
démonstration du lemme 1 du fait que la fonction w (x) est encore 
<ontinue, et lorsque £ se trouve à l’intérieur des intervalles (t;, t;+:) 
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(dont les limites sont des instants de discontinuité des commandes 

u (t)), le point w (x (t)) se situe en dehors de M et donc dans ces inter- 

9u(z(t)) 
ot; 


valles les dérivées existent bien et sont continues. 


2°. Soient maintenant 6,, 6., . .., 6, tous les instants de l’inter- 
valle (£o, ti), où la trajectoire x ({) coupe l’ensemble M; de plus, 
lt) <a LBeL...<8,<t,. Introduisons encore les notations 


Lo — 6,, lb — 6,41. 


A chacun des intervalles [0;, 6;4,] (i—0, 1,...,s) on peut appliquer 
la remarque 1° et obtenir 


Oiti — 0 > © (x (6:41)) — © (x (0)  ( = 0, 1, ..., s). 


En additionnant les premiers et les seconds membres de ces relations 
associés aux intervalles de temps [0,, 0;4,] (à — 0, 1,...,s),on a la 
relation 


Osti — 00 > © (x (Bs+1)) — © (x (06), 


qui coïncide avec l'inégalité (14) imposée par la condition du lemme. 
Le lemme est ainsi démontré. 


Notons que la situation qui a lieu dans le problème de la réponse en temps 
minimal (cf. l'exemple de la fig. 15.1) n’obéit pas aux conditions du lemme 2. 

En effet, dans cet exemple (fig. 15.1, 15.2) ce ne sont pas des points isolés 
mais un arc de la trajectoire optimale qui se situe sur la ligne de commutation 
AOB, c'est-à-dire, dans les termes du 
lemme 2, tout un arc de la trajectoire B 
optimale se situe dans l’ensemble 
M. La condition du lemme 2 n’admet 
l'intersection de la trajectoire opti- 
male avec l’ensemble M qu'en un 
nombre fini d'instants. Or, dans le 
cas considéré, la trajectoire optimale 
se trouve dans l’ensemble M pendant 
un certain intervalle de temps. 

Cette difficulté est levée par le 
lemme 3 qui suit. 


Lemme 3. Conservons les 
hypothèses du lemme 2 sur la fonc- 
tion w. Soit u(t) (ty LL ti) la 
commande admissible qui ramène le point représentatif de la position x° 
en position x*; en outre, la trajectoire correspondante x (t) êst située 
tout entière dans D. Supposons encore qu'il existe aussi près que l'on 
veut de x° un point y° tel que latrajectoire y (t) issue de y° et associée à 
la même commande u (t) (t << t L !L,) ne coupe M qu'en un nombre 
fini d'instants. Alors le critère (14) 


h—to > © (x) — o (x) 


Fig. 15.2 


est encore urai. 
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Démonstration. Choisissons un nombre arbitraire e > 0 
et soient W° et W* (fig. 15.2) respectivement les voisinages des 
points x° et x* tels que 


| © (x) — © (x) | Le pour pit 
| & (x) — w(z*) | Le pour x E W#. 


D'après le théorème qui établit la dépendance continue entre les 
solutions des équations différentielles et les conditions initiales, 
il existe un voisinage W°’ & W® du point x° tel que toute solution 
du système d'équations analogue au système (1) (de même commande 
u (4) (to << t)) 


dy; 
= Ji (y ses Yns Uiy css Ur) (j=1,...,n), (15.19) 


(15.18) 


telle que y (4) € W®’, est définie dans l'intervalle #, < ?t < t; tout 
entier et vérifie la relation y (£,) € W®. 

Conformément à la condition du lemme démontré on peut ad- 
mettre que la solution y (t) (to < t < t,) du système (19) aux données 
initiales y (t,) € W°®’ ne coupe M qu’en un nombre fini de points. 
En vertu du lemme 2 on en déduit l'inégalité 


© (y (4)) — © (y (o)) < 4 — to (15.20) 


Ensuite, puisque y (4) € W®& W, il vient y(t:) E W®*. Par 
conséquent, d’après (18), on a 


‘ | © (y (o)) — © (2) 1<e, 
Deere | Pr 
Les relations (21) entraînent 
& (y (to) — w (x) < 8, _ 
EP PE DS ee 


En additionnant les premiers et les seconds membres des inégalités 
(20) et (22), on obtient 

Oo (z*) — © (2) Lt, — to + 2. (15.23) 
Comme e est arbitraire, on en tire l'inégalité (14). 

Le lemme 3 donne les conditions les plus générales pour que le 
critère (14) soit vrai. Toutefois, ces conditions sont formulées séparé- 
ment pour chaque commande z (t). Il reste encore à montrer que ces 
conditions sont vérifiées pour toute commande uw (t). 

Dans les ouvrages déjà cités, V. Boltianski montre que sous 
certaines contraintes imposées à l’ensemble M les conditions du 
lemme 3 sont respectées quelles que soient les commandes admissibles 
u (t). Il en est ainsi, en particulier, si M est un ensemble lisse par 
morceaux de dimension <n. 
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Donnons la définition de l’ensemble lisse par morceaux [15]. Soit À un 
lyèdre convexe borné de dimension s (s < n) qui repose dans l’espace vectoriel 

E des variables E,, E,, ..., &, et qui est considéré avec sa frontière (c'est-à- 
dire qu'il est fermé). Supposons que dans un ensemble ouvert de l’espace & 
qui contient le polyèdre X sont données n fonctions continüment dérivables 


Pi (Eu barres 20) (=1,2,...,n), (19.24) 


qui jouissent de la propriété suivant laquelle le rang de la matrice fonctionnelle 


en tout point E € Æ est s. Les fonctions (24) réalisent une application lisse @ 
du polyèdre Æ dans l’espace X d’après les formules 


Zi = Pa (Enr Êar © + es Ës) (= 1,...,n). (145.25) 


Si cette application est biunivoque (c'est-à-dire si elle associe aux points dis- 
tincts du polyèdre X des points distincts de De pere X), l’image L = (K) 
du polyèdre X est dite polyèdre curviligne de dimension s dans l'espace X. 
Il est clair que le polyèdre curviligne est un ensemble borné et fermé de l’espace X. 

Soit maintenant D un ensemble ouvert de l’espace de phase X. Tout en- 
semble M & D qui est une réunion d’un nombre Îini ou infini de polyèdres 
curvilignes tels que tout ensemble borné fermé reposant dans D ne coupe qu'un 
nombre fini de ces polyèdres, s'appelle ensemble lisse par morceaux dans D. 
(Les polyèdres peuvent s'accumuler vers la frontière de D.) 

Si parmi les polyèdres curvilignes dont la réunion est un ensemble lisse par 
morceaux M il y a au moins un polyèdre de dimension k, alors que tout autre 
polyèdre est de dimension inférieure ou égale à k, l’ensemble lisse par morceaux 
est dit de dimension k. En particulier, toute surface lisse fermée dans D de 
dimension inférieure à nr est un ensemble lisse par morceaux dans D (du fait 
ques peut être partitionnée en polyèdres curvilignes). Ce qui vient d’être 

it entraîne qu’un ensemble lisse par morceaux dans D de dimension inférieure 
à n ne possède pas de points intérieurs. 

Indiquons à titre d'exemple que pour nr = 2, les ensembles lisses per mor- 
ceaux de dimension <2 sont composés de lignes formées de morceaux dérivables 
particuliers (ligne AOB de la fig. 15.1, par exemple). 


Le lemme suivant est donné sans démonstration du fait que celle- 
ci impose l'utilisation des notions relatives à la théorie des variétés 
lisses ; cette démonstration est exposée dans les ouvrages cités de 
V. Boltianski [15]. 

Lemme 4. Soit M un ensemble lisse par morceaux dans D de 
dimension Sn — 1. Soit, ensuite, u (t) (4, Lt L1,) une commande 
admissible qui ramène le point représentatif de la position x° en position 
x* ; de plus, la trajectoire correspondante x (t) (tt <t <t,) repose 
tout entière dans l'ensemble D. Alors, dans tout voisinage W® du point 
z° il existe un point y° tel que la trajectoire y (t) (th Lt L1,) issue 
du point y° et associée à la commande u (t), repose toute entière dans D 
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et ne coupe M qu'en un nombre fini de points, c'est-à-dire il n'existe 
qu'un nombre fini d'instants t (th Lt Lt) tels que y (t) E M. 

Les lemmes 3 et 4 entraînent immédiatement le lemme principal 
suivant. 

Lemme principal. Soit M un ensemble lisse par morceaux 
de dimension <<n contenu dans l'ensemble ouvert D de l’espace de pha- 
se X. Supposons qu'on donne sur l'ensemble D une fonction continue 
© (x) = &(z,, ..., x,) telle qu'aux points n'appartenant pas à 
l'ensemble M, elle possède des dérivées continues et vérifie l'inégalité (8) 


n ue 
D D fi(e, u) LA. 


i=1 


Alors, si u (t) (bb Lt t,) est une commande admissible qui ramène 
le point représentatif de la position x° en position x*, la trajectoire cor- 
respondante x (t) reposant tout entière dans l'ensemble D, le critère (14) 


li — to > © (z*) — © (2°) 


est vrai pour la durée de la transition. 

Les résultats exposés ci-dessus conduisent au théorème suivant, 
obtenu dans l'ouvrage [14] de V. Boltianski, qui exprime la 
condition nécessaire et suffisante d'optimalité sous la forme de 
la méthode de programmation dynamique pour le problème de la 
réponse en temps minimal. 

Théorème [14]. Soit M un ensemble lisse par morceaux de dimen- 
sion <<n inclus dans l’espace de phase X, et w (x) = &© (x,,. . ., Tn), une 
fonction continue donnée sur X et possédant des dérivées continues aux 
points qui n'appartiennent pas à l'ensemble M. Soit, ensuite w (x*) = 0 
pour un point x* € X. Supposons que pour tout point x° € X différent 
de x*, il existe une commande admissible u (t) = u,+ (t) qui ramène 
Le point représentatif de la position x° en position z* en un temps —w (x°). 
Pour que toute commande u0 (t) soit optimale, il faut et il suffit qu'en 
tout point x n'appartenant pas à l'ensemble M, la fonction w (x) 
vérifie l'équation de Bellman (7) 


max (D fi (e, u)]=1 
Le | 


ou, ce qui revient au même, l'inégalité (8) 


D hau<i (UE). 
1=1 


‘Démonstration. La nécessité de la condition du théorème 
est démontrée de même qu'à la page 226. La démonstration que l’on 
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y donne est applicable à tout point z = z° où les dérivées 


(i = 1,..., n) existent et sont continues. 

La suffisance résulte du lemme principal. En effet, il résulte de 
ce dernier que si la relation (8) est vérifiée en tout point x n’apparte- 
nant pas à l’ensemble M et, de plus, si & (z*) = 0, la commande qui 
ramène le système de z° à x* en un temps —«w (x°) est optimale. Pour 
o (z*) = 0, le critère de la durée de transition du système de zx° 
en z*, quelle que soit la ru admissible, est 


c’est-à-dire cette transition ne peut être datés plus vite qu’ en un 
temps — (r°). 

Dans le théorème qui vient d’être démontré les contraintes impo- 
sées à la fonction w (x) d'être continûment dérivable sont si faibles 
que ce théorème peut être appliqué à un très grand nombre de pro- 
blèmes variés. C’est ce qui justifie la méthode de programmation 
dynamique. 

3. Conditions suffisantes d’optimalité du problème général de 
programmation dynamique. Pour ce problème, l'équation de Bell- 
man (14. 36) a été obtenue au $ 14, point 2. L'expression (14. 36) 
entraîne que pour toute commande u (6) € (2 qui fait passer le système 
de la position initiale x ({) en position z*, on a l'inégalité 


G(z, u)+ 2 TE fi(x, u)>0 (15.26) 
ou 
SO (re u)>—G(ru) (ES), (15.27 


i=!{ 


où l'égalité a lieu pour la commande optimale u* (4). 
Maintenant, si à l’aide de la relation 


© (x) = —O (x), (15.28) 


on introduit la fonction w (x), l’inégalité (27) devient 


D En fi(z, u)<G(z,u) (UE). (15.29) 


i= 1 


D'une façon analogue au point 2 on démontre pour le problème 
général traité ici le théorème qui donne les conditions nécessaires 
et suffisantes d’optimalité [141]. 

Théorème. Soit M un ensemble lisse par morceaux de dimen- 
sion <n contenu dans l’espace de phase X et w (x) = © (x1, .- . ., x,) 
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une fonction continue donnée sur X et possédant des dérivées continues 
aux points qui n'appartiennent pas à M. Soit, ensuite, w (z*) = 0 
pour un point zx* € X. Supposons que pour tout point x° € X différent 
de x*, il existe une commande admissible u (t) = u, (t) qui ramène le 
point représentatif de la position x° en position x* et qui vérifie la 
relation 


t1 
| G(x(t), u(t))dt= —o (x). (15.30) 
to 


Pour que toute commande us (t) soit optimale, il faut et il suffit 
qu'en tout point x n'appartenant pas à l'ensemble M, la fonction 
wo (x) vérifie l'équation de Bellman (14.36) 


dw (z) 
ox i 


mise n-2 


i=i 


fax, u) | —0 


ou, ce qui revient au même, l'inégalité (29) 


D he WEC(su) (UE). 
i=1 


$ 16. Relation entre l'équation de Bellman 
et l'équation de Jacobi-Hamilton 
dans les problèmes de mécanique analytique 


[ 
1. Problème de minimisation de l'intégrale Q — | G (x, u, v) dv. 
to 
Considérons le système décrit par l'équation différentielle vectorielle 


= f(x ut), (16.1) 
où z, f, ainsi que u sont des vecteurs de dimension n 
Fe ar 1 TO — hit, ut) 
Z = 2 u = rer Î(x, U, L) = DS Le 2 : 
_ In __ Un nu, tt) 


L'état initial du système 
[x (time = Z (to) (16.2) 
et l’état du système à l'instant £ sont donnés. Trouver la commande 
u — u* (t), (16.3) 
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qui ramène le système de l'état x (f,) à l'état x (£) en minimisant 
l'intégrale 
t 


Q= | G(x(v), u(v), v)dv. (16.4) 

Introduisons les étions , 
W (& (0), 9 = min | G{z(v), uv), v) dv. (16.5) 

UV to 


Soit u* (v) (0 < v < t) la commande minimisant l'intégrale (4) 
et x (v) la trajectoire de phase (fig. 16.1) associée à cette commande. 
Il vient 


t 
W (z(t), t) = | G(z(v), u* (v), v) dv. 
to 


Prenons sur la trajectoire optimale (fig. 16.1) le point x (t — At). 
Puisque la position du système au point final £ — At de l'intervalle 


x, x{t-At) 


T(L) 


Fig. 16.1 


(£o, { — At) est fixée, l’arc de la trajectoire optimale entre les points 
z (to) et x (t — At) est lui-même une trajectoire optimale. C'est 
pourquoi pour W (x (£ — At), t — At)) on a l'expression suivante 
t 
W (z(t— At), t—A=W (z(t), — | G(z(v), u* (v), v) dv. 
t=at 


Comme 
(16.6) 


| G(z(v), u*(v), v)dv=G(zx(t), u*(t), t) At+ oi (At), (16.7) 

Fr. 
W(z(t— Ad, 1— Ah =Wi(z(t, D —G(z(t), u*(t,t) At — 
— 01 (At). (16.8) 


236 MÉTHODE DE PROGRAMMATION DYNAMIQUE (CH. 4 


Supposons maintenant que la fonction W (x, t) est continue et pos- 
sède partout des dérivées partielles continues par rapport à tous ses 
variables. Puisque d’après (1) pour u = u* (t) 


2 ()—$ (a, u° (0), D At+o (9, (16.9) 
on a 
WG AD, 1— AD = W(x(t—f(x(t), u°(#), D At+ 


ôW (x. t) 
ÔZ; 


+ 02 (At), t— At) =Wi(z(,t)— Ÿ 


i—=! 


OW (x, t | 
— F9 434 05 (AP). (16.10) 


fix, u*, t) At— 


En portant l'expression (10) dans le premier membre de l'équation 
(8), on obtient 


i= | 
— —C(z,u", HAt+o,(AD. (16.11) 


En divisant tous les termes de (11) par Af et en tenant compte que 


lim -2@) — 0, on obtient à la limite pour At — 0 Ia relation 
At—0 


Gear, D MED fu, D ME O (1642 


. 
1= | 


ou la relation équivalente 


n 
: OW (x,t) dr; oW (x, t) 
G (x, U , PER R e (16.13) 
1= 

Les raisonnements qui nous ont conduits à la relation (6) entrai- 
nent que la relation (13) conserve encore sa forme dans le cas du 
problème de mazximisation de l'intégrale (4). 

2. Obtention de l'équation de Jacobi-Hamilton à partir du prin- 
cipe de Hamilton. Le principe de Hamilton consiste dans le fait que 
pour un mouvement réel entre deux configurations du système 
données aux instants {, et £ (il s’agit de la position du système dans 
un espace qi; 92 . +. 4n et non pas dans un espace de phase), la valeur 


de l’intégrale L dt (où L est la fonction de Lagrange) est stationnai- 


re. Désignons cette valeur stationnaire par W. 
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{ 
La valeur stationnaire de l'intégrale | L dt est assurée en vertu 


lo 
des équations du mouvement du système 


dqi … 0H 

dt Op; ? 

de ol (16.14) 
dt dq G=1,...,n), 


On peut pourtant adopter un autre point de vue. 
Supposons que l’espace des configurations q,, . . ., 4, du système 
(14) est l’espace de phase d’un autre système régi par les équations 


d " | 
= fi (qu +. Qns Pis ces Pnit)  (i=1,...,n), (16.15) 


0H 
Ïi (g:, es {ns Pis es Pn) à ee re (16.16) 


est une fonction connue de ses variables. Ainsi, on connaît la forme 
des fonctions f, des seconds membres des équations (15). 
t 


Le mouvement réel assure à l'intégrale Î L dt une valeur station- 


to 
naire. On peut donc identifier en pensée p,, Po, + + +» Pn à des com- 
mandes u*, u>, ..., un du système 


d ; \ 
= fi (qu ces Ans Us ce. Un; L) (= 1, 8); (16.17) 


t 
telles qu’elles extrémisent l'intégrale | L dt, c'est-à-dire à des com- 


t 
mandes optimales du système (17). : 


D'après ce qui a été démontré, les fonctions u* (t) intervenant 
dans la relation (13) sont elles-mêmes des commandes optimales. 
C'est pourquoi la relation (13) du système décrit par les équations 
(17) peut être mise sous la forme 


Lqis +. Qns Qt ++. Qns 1) = 


. 0W (q,t) da; OW (q, t) 
_ >) on dt A + (16.18) 
ES | 


On sait que pour le système (14) la fonction de Hamilton est 
À (g:, .. In»: Qi, 0 L) = 


e e be ÔL e 
= —L (g1, cs ns te es An» lt) + » et (16.19) 
i=1 0di 
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En tenant compte du fait que 


mæ = (i=1,...,n), (16.20) 


et en exprimant g, par les variables canoniques 


Qi = Qui - +. Ans Pas ++ Pnst) (= 1,...,n), (16.21) 
on ramène la fonction Æ à des variables canoniques 
H = H (qu ..., Qns Pis + + + Pns Ÿ)- (16.22) 
L'équation (18) peut s'écrire 
n 
0oW * 0W ° 
— — L(q, -+.s Qns Gas - + +1 On) + ar di=0. (16.23) 
1 
. En dérivant par rapport à di le premier et le second membre de la 
relation (18), on trouve 
_ôL __9W(q,t) 
ôqi dqi 
Il s'ensuit qu'en remplaçant dans les expressions (21) les variables 
Pr Par 


(=l;::.5n). 


= (i=1,..,n) (16.24) 
on obtient 


: : 0W oW : 
qi = Gi (a °..) fn: "dqu ? #3 "9qn * t) (= 1, *.. n). (16.25) 


En substituant maintenant dans l'équation (23) à Qi les expressions 
(25) on ramène (23) à la forme 
0W 0W 0W 
+4 (a LE LR Gi t)=0. (16.26) 
L’équation aux dérivées partielles (26) est précisément l’équa- 
tion de Hamilton-Jacobi pour un système mécanique dont le mou- 
vement est décrit par les équations différentielles (14). 


Exemple. Considérons à titre d'exemple le système à un degré de 
liberté où l'énergie cinétique T7 et l'énergie potentielle V s'écrivent 


14 1 
T — EH mq?, V=— cg?. (16.27) 
La fonction de Lagrange est 
L=+ mg eg2. (16.28) 
Comme 
er (16.29) 


aq 
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on a 
g=. (16.30) 
m 
D'après (19), dans le problème traité la fonction de Hamilton s'écrit 
À : q2 2 
À = —L LS LL a A (16.31) 
. 0q 2 2 


En remplaçant dans (31) q par l'expression (30), on ramène la fonction de Ha- 
milton aux variables canoniques 


p? , cq® 
Les équations canoniques du mouvement du système 
dq 0H 
“dt op 
0H (16.33) 
dt  ôdq 
deviennent en vertu de (32) 

dg : 
am P | 

. (46.34) 
a  — — cg. 

dt 


Dans l'exemple considéré, l'action hamiltonienne est la fonction 


t t 
| ” 4 : 
W = | Lät= | [7 mat (D cg? @] dt. (16.35) 
0 to 
D'après (34) et (30) l'équation (17) de notre exemple se met sous la forme 
Tu. (16.36) 
Conformément à (28) la fonctionnelle (4) à minimiser est ici 
t 
2 2 
e=| [Se -21 dt. (16.37) 
to 


La valeur extrémale W de la fonctionnelle @ est atteinte lorsque la com- 
mande optimale u = u* (t) qui en vertu du principe de Hamilton doit être 


u* (4) = p, (16.38) 
car ce n'est que pour une telle commande que l’action W satisfait à la con- 
dition ÔW = 0. 

L'équation (13) devient alors] 
p? _ 1 + _0W:°-_ 0W_ ; 
Dm D Lg Go 
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D'après (24), remplaçons dans l'expression (30) la variable p par 


7 (16.40) 


SLA (16.41) 


En portant dans (39) au lieu de q l'expression (41), ramenons l'équation (39) 
à la forme | 
0W, 1 /9W\2 1 
ne — ca? = 0) 
dt ‘ 2m (3) +4 ne (16.42) 
L'équation (42) est l'équation de Jacobi-Hamilton relative à l'exemple considéré. 
Comme d’après (32) la fonction de Hamilton de l'exemple traité est de la 
forme 
P 


A (q, Pr Je 7) 9? 


l'équation (42) peut s'écrire 
oW 0W | 
— + II (9. 71 , t} = (), (16.43) 


CHAPITRE 5 


..…. = 


PRINCIPE DU MAXIMUM DE L. PONTRIAGUINE 
DANS LA THÉORIE DE LA COMMANDE OPTIMALE 


$ 17. Théorème de la condition nécessaire d'optimalité 


1. Principe du maximum de Pontriaguine. Le système com- 
mandé est décrit par les équations différentielles 
dr; : 
= ie: ee.) Ln) Us, .... Ur) (j = 1, .., n). (17.1) 


On demande de ramener le système du point zx ({,) de l’espace de 
phase X de dimension n au point donné xz*. L'’instant f, où le point 
représentatif tombe en z* n’est pas fixé à l’avance. 

La commande v ({) est un vecteur fonction continu par morceaux 
dont les valeurs appartiennent à un certain ensemble borné fermé Q 
de l’espace U de dimension r 


u E Q. (17.2) 


Les fonctions f; (x, ..., æn, u,, ..., u,) (j = 0, 1, ..., n) 
sont définies pour des valeurs quelconques de x € X et u € Q. On 
les suppose continues par rapport à l’ensemble des variables x,, ... 
sr Tns Ur + - +, U, €t continüment dérivables par rapport à x;,... 

RE 

La commande «x doit être choisie de façon à minimiser la fonc- 

tionnelle 
t 


Q= | fox (E), u (E)) dE. (17.3) 


Désignons par x, (t) la fonction déterminée par l'équation diffé- 
rentielle 
dxo 
5 = Jo (ai; ee.) TIns Us oo, Ur) (17.4) 


et par la condition initiale 


Lo (Lo) — 0. (17.5) 
La fonctionnelle Q à minimiser peut être mise sous la forme 
Q = zo (t)- (17.6) 


16—0393 
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Supposons qu’en plus du système d'équations principal (1) et 
de l'équation (4) qu’on peut écrire ensemble 


fu)  (G=0,1,...,n), (47.7) 


on ait encore un système d'équations par rapport aux variables 
auxiliaires Vo: LE CCE TX | Ÿn : 


d à és, 
= D nt. (k—0, 1,...,n). (17.8) 


Si nous choisissons une commande admissible u (t) (LH <t<t:) 
qui fait passer le système (1) du point x (f,) en z*, et si nous avons 
une trajectoire de phase correspondante zx (t) du système (7) à condi- 
tion initiale x (4), zo (to) = 0, le système d'équations (8) devient 


du 5 ED UO D (=0,1,...,n) (17.9) 


OTh 


C'est un système des équations différentielles linéaires homogènes à 
coefficients variables. Quelles que soient les valeurs initiales de 1; 
il admet une seule solution 


Ÿ = (Pos Pas + + + Vn)- 


Toute solution du système d'équations (9) (quelles que soient les 
conditions initiales) est dite solution du système (8) qui correspond 
à la commande retenue uw (t) et à la trajectoire de phase z (t). 

En introduisant les notations 


H(ÿ, x, u)= 2 Wifi (x, u), (17.10) 
on aura 
0H 
où À (x, u);, (17.11) 
0H és ôfi(z, u) 
en = > Ÿi ne (17.12) 
1=0 


et les systèmes d'équations (7) et (8) peuvent s'écrire 


dr} oH . 
d'}; 0H ; 
ge U=0,1,...n). (17.14) 
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Le problème posé ci-dessus’ se résout à l’aide du principe du 
maximum de Pontriaguine énoncé et démontré [72] sous la forme 
du théorème qui suit. 

Faisons au préalable les remarques suivantes. En prenant une 
commande admissible arbitraire u (t) (t0 < t < t,) (c’est-à-dire une 
commande qui ramène le système du point z (#) au point z* et”qui 
satisfait aux contraintes uw € Q) et la condition initiale zx (£,), 
zo (to) = 0, on peut trouver la trajectoire x (4) = (xo (£), za (4), . . 

. . Zn (t)) correspondante (c'est-à-dire vérifiant le système (13)). 
Ensuite on peut obtenir les solutions du système (14) associées aux 
fonctions uw (t) et x (t) 


Ÿ (£) cE (Po (£), Yi (£), ss Ÿn (£)). 


Lorsque les valeurs de + et de x sont fixées (constantes), la fonc- 
tion H des variables x,, . .., æn, wo, Vus + + +» Vns Un, - . +, Ur 


H (bp, z, u)= à Yifi (x, u) 


devient fonction du paramètre u € 9 ; désignons la borne supérieure 
des valeurs de cette fonction par M (+, x) 


M (v, 2)= sup À (+, TZ, U). (17.15) 
u€ 


Si la borne supérieure exacte des valeurs de la fonction continue H 
est atteinte en un certain point du domaine de commande ©, M (1, x) 


est alors le marimum des valeurs de la fonction À pour 4 et zx fixées. 
Par suite le théorème énoncé ci-dessous (condition nécessaire d’op- 
timalité), dont le contenu principal est traduit par l'égalité (16), 
est nommé par son auteur principe du maximum. 

Théorème 1Â1 (principe du maximum de 
L. Pontriaguine [72]).Soit u (t) (t < t < t1) une commande 
admissible telle que la trajectoire x (t) qui lui correspond, issue à l'ins- 
tant t, du point x (t,), passe à l'instant t, par le point x*. Pour que 
la commande u (t) et la trajectoire x (t) soient optimales, il faut qu'il 
existe un vecteur fonction non nul et continu 4 (t) = (bo (£), db (4), . .. 
ss Ÿn (4)) associé aux fonctions u (t) et x (t) tel que 

1°. Pour tout instant t (t, < t < t;) qui est un point de continuité 
de la commande u (t), la fonction H (ÿ(t), x (t), u) de la variable 
u € S atteint au point u = u (t) le maximum 


À (b (1), z (0), u (09) = M (+ (e), x (0). (17.16) 
2°. A l'instant final t, on a les relations 
Vo() SO,  M(p(t), x (t)) = 0. (17.17) 


16° 
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Il s'avère ensuite que si les grandeurs v (t), x (t) et u (t) vérifient 
«système (13), (14) et la condition 1°, les fonctions, (t) et M{w(t), x (t)) 
de la variable t sont constantes de façon que la vérification des 
relations (17) peut s'effectuer non pas à l'instant t, mais à un instant 
quelconque t(b St ti). 

2. Principe du maximum de Pontriaguine dans le problème de 
la réponse en temps minimal. On peut tirer du théorème 1 la con- 
dition nécessaire analogue d'optimalité du problème de la réponse en 
temps minimal. À cet effet, il faut poser en vertu de (3) 


fo (x, u) = 1. (17.18) 
D'après (10) et (18) la fonction À s'écrit 


H (+, x, u)=h+2 difi (x, u). (17.19) 
Désignons par 1 le vecteur de dimension n 
Ÿi 
p=| Ÿ |, (17.20) 
Ya 
et par À (1, x, u) la fonction 
H (Ÿ, zx, u)=— 2 difi (x, u). (17.21) 


Les équations (1) et les équations (8) peuvent être mises sous la 
forme | 


dx} 0H : 

at — 0 (j= 1, sn) (17.22) 
d oH | 
RE er Dern 020) 


Pour des valeurs fixées de Ÿ et de x, la fonction H devient fonction 
du paramètre uw; désignons par M (ÿ, x) la borne supérieure des 
valeurs de cette fonction 


M (p, z)=sup}H (p, x, u). (17.24) 
uCEQ 
Puisque d’après (21) et (19) 
| H Gb, z,u) = (bp, x, u) — (17.25) 


on obtient que : 
M (h, 2) = M (b, 2) — Vo: (17.26) 
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C'est pourquoi les conditions (16) et (17) s’écrivent 
Hp), z(), u(t)) = M (b(1), x (Et) = —bo 0. (17.27) 


Ainsi, on obtient le théorème suivant [72]. 

Théorème 2 (principe du maximum dans 
le problème de la réponse en temps mini- 
mal). Soit u(t) (tb Lt t,) une commande admissible qui ramène 
le point représentatif de x (t,) en x*, et x (t), la trajectoire correspon- 
dante telle que x (t,) = x*. Pour que la commande u (t) et la trajectoire 
x(t) soient optimales (quant à la réponse), il faut qu'il existe 
un vecteur fonction continu non nul à (t)=(1, (£), Da (6), . . ., Yn (4)), 
associé aux fonctions u (t) et x (t), tel que 

4°. Pour tout instant t (t) Lt Lt), qui est un point de continuité 
de la commande u (t), la fonction H (b(t), x (t), u) de la variable 
u € Q atteint en u = u (t) le maximum 


H(h(t), z(), u(t)) = M (p(), z (1). (17.28) 
2°. À l'instant final t, la relation 
M (b (4), z (4) > 0 (17.29) 


est observée. 

Il se trouve ensuite que si les grandeurs v (t), x (t), u (t) satisfont 
au système (22), (23) et à la condition 1°, la fonction M (1 (t), x (t)) 
de la variable t est constante et il n'est pas de rigueur de vérifier la 
relation (29) à l'instant t,, on peut le faire à un instant quelconque 
t(b Lt ht). 

3. Démonstration du théorème sur la condition nécessaire d'op- 
timalité (principe du maximum) du problème à temps fixé 7’ et à 
extrémité libre de la trajectoire. Dans le cas général, la démons- 
tration du principe du maximum est assez compliquée. C'est pour- 
quoi nous allons nous borner à l'exposé d'un seul cas particulier 
relativement simple. 

Considérons le système régi par les équations différentielles 


TI 
= f, (Zi, Tes ce, Tn, Us, Uo, .., Ur)=f;(zs u) (17.30) 
(=: 0); 
auxquelles est équivalente l'équation différentielle vectorielle 
= f(x, u), (17.31) 
où x, u et f sont les vecteurs 
7 Zi ui ” f(x, u) 
TL = e + -s , U = . + , 1(x, u) = CR : (17.32) 
_ Tn _ Ur _Jn(z, u) 
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La commande u (t) est un vecteur fonction continu par morceaux ; 
elle doit satisfaire aux contraintes 


u € Q. (17.33) 
L'état initial du système est donné 
[x (4)}emmto = Z (to). (17.34) 


On demande de trouver la commande u(t) (4 St T) qui 
vérifie les contraintes (33) et minimise la fonctionnelle 


T 
Q= | fox (E), u (E)) d, (17.35) 
to 


où 7 est une grandeur fixée. 
Désignons par x, (t), de même qu’au point 1, la fonction scalaire 
déterminée par l'équation différentielle 


0 = ff, Tes ee, Ens War Ua, cs Wr)= fo(z, u) (17.36) 


et par la condition initiale 


[zo (t)l=t) = 0. (17.37) 
(36), (37) et (35) entraînent que 
Q = x (T). (17.38) 


Désignons ici la commande optimale par à (t). La trajectoire 


z (t) associée à cette commande est optimale. 

La commande optimale à (t) est un vecteur dont les coordonnées 
ñ; (t) peuvent, comme nous l’avons dit, avoir les discontinuités de 
première espèce en un nombre fini de points de l'intervalle {, <t<T. 

Examinons un intervalle de temps infiniment petit t —e <1< 
< T;où &e est un infiniment petit, et TE (to, T). 

Attribuons à la commande à (ft) une variation en remplaçant 
ü (t) dans l'intervalle de temps infiniment petit T—e<t<7€7 
par une autre commande w (sans changer la commande à (t) en dehors 
de cet intervalle infiniment petit). 

Constatons qu'ici on ne demande pas que l'accroissement u, ({) — 
— dit) i =1,...,7r), où tE (tT —e, t), soit infiniment petit. 
Si la contrainte (33) est, par exemple, de la forme | u, | Sm;, l'ac- 
croissement u, (t) — à; (t) (tE (t — e, t)) peut prendre n'importe 
quelle valeur k;, où 0 < | 4; |[S2mu. 

Toutefois, comme e est un infiniment petit, l'impulsion [u, ({) — 
— üy(t)le (i = 1, ..., r) de l’accroissement de la commande est 
également infiniment petite. Cherchons la variation de la trajectoire 
du système produite par cette impulsion. En vertu des équations 
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(30) et (36) on a 


0-8 0=[(%) (4. Je 
=[fi(x(), u(n)—f(& (x), u(D)le+ 0 (e) (17.39) 


(j—=0, 1,...,n). 
D'après (39), la différence x; (x) — zx, (x) est une grandeur de 
même ordre de petitesse que &. Il s'ensuit que f; (x (rt), u (t)) — 
— f, (x (rt), u (t)) est également une grandeur de même ordre de 


petitesse que &. Il en résulte que la relation (39) peut être remplacée 
par la relation 


tnt) =lfi(z(r), u(t))—fi(z(r), u(R))e+oi(e) (17.40) 
(j=0, 1,...,n). 


Introduisons maintenant les fonctions ôx;, (t) (j = 0,1,...,n) 
à l'aide des relations 


Tj (£) 7 Z; (t) Zn Ôt; (t) (TEST ; j = 0, 1, 2, 1 n). 
(17.41) 

Les fonctions zx, (t) s'appellent variations des coordonnées. 

Comme on le voit de (40), l’ordre de petitesse des variations 
Ôx, est le même que celui de e. Par suite lors de la recherche des 
équations auxquelles satisfont les fonctions Ôôx, (j = 0, 1, ..., n) 
nous négligerons les grandeurs o (e). 

D'après (40) et (41), à l’instant & — + les valeurs des variations 
ôz; sont 


6x; (r) = lf;(z (x), ur) —f;(& (x), G(r))le. (17.42) 
Dans l'intervalle de temps t < t < T, la commande w coïncide 
avec la commande optimale à (t). Les équations différentielles 


vérifiées par les variations Ôz, (t) (T<t< T) peuvent s'obtenir 
de la façon suivante. D'après (30), (36) et (41), on a 


dx d (ôz 2 n à : 
— DE jy Gr + 6 .., Zn + ÔTn, Ui, ..., Ur) (17.43) 
U=0d; 1; n). 
En développant les seconds membres de (43) en séries de Taylor 
dans le voisinage de z, (£), ..., z, (t), on obtient 


dry  d(6x)) = > + : 
Ar dt = fj(tis -.., Zn, Us, .., Ur) + 


+5 53 Œur sr Enr sr st) 5, + o(ôre, Ôty, -.., ÔTn) 


OTRh 
k=0 


(j=0,1,...,n). (17.44) 
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D'après (30) et (36), les premiers termes des premiers et des se- 
conds membres des équations (44) s’annulent. C'est pourquoi en 
rejetant dans (44) les termes qui contiennent ôz, à la puissance deux 
et aux puissances supérieures et dont l’ensemble se note o (ôx,, Ôx;, . .. 
+ ÔZh), On obtient le système d'équations différentielles linéaires 
suivant par rapport à Ôx;, 


d(ôr)  < ôfj(£, à 
— 5 DE 67, (j=0,1,2,...,n). (17.45) 


ÔTR 
R=—0 


Les équations différentielles (45) auxquelles satisfont les varia- 
tions Ôx, s'appellent équations aux variations. 
Notons que si l’on introduit les matrices 


ôfo lo oo 
Oxo  OZzy Oro ‘  Ozn | ôxo 
_Ôfs Of1 ôfh afs x 
F(z,u)=| Oro dr 072 ‘den |, ôr=| À‘ |, (17.46) 
fn Ôfn. ln dfn Ôtn 


L'org 071 072 ‘‘  Ozn À 


le système d'équations différentielles scalaires (45) peut être mis 
sous la forme d’une équation différentielle vectorielle équivalente 


d(ôx) __py: © 
n=F(r, u) Ôx. (17.47} 


La matrice F* (x, u) transposée de la matrice F (x, u) a, d'après 
(46), la forme 


m Ofo Of1 Of: Ôf à 
ro dZ0 070 070 
ôh 2h ds. On 
F*(z,u)=| 071 O1 OÔri ©  Ôx |. (17.48) 
Ôfo Of Ôfe 0fn 


Désignons par 14 le vecteur de dimension (nr + 1) 


Vo 


Ÿi 
p=| w |, (17.49) 
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qui vérifie l'équation différentielle vectorielle 
À — F°(z, u)Ÿ. (17.50) 
L'équation différentielle vectorielle (50) est équivalente au 
système d'équations différentielles scalaires 


d : ôfi(z,u 
=D a | (k=0,1,2,...,n). (17.51) 
i=0 


Le système d'équations différentielles (51) coïncide avec le 
système d'équations (9) qui a été introduit au point 1. 
Conformément à (47) et à (50), on a la relation 


(DO, 82 (= LE, 82) + Ch, 87) = 
= (— Fr, Ôx) + (ÿ, Fôr) — —W*Fôt+W#*Fôr—0, (17.52) 
d'où l'on tire que 
> VŸ; (4) Ôx: (£) = const (T LIST). (17.53) 


L'expression (53) que nous venons d'obtenir est la relation connue 
de Lagrange pour des systèmes conjugués d'équations différentielles 
linéaires homogènes que sont, par définition, les systèmes représentés 
par les équations vectorielles (47) et (50). 

D'après. (38), 
| 0Q a. Ôto (7), 


et comme la commande optimale à ({) minimise la fonctionnelle @, 

toute autre commande différente de la commande optimale conduit 
à l'inégalité 

ÔQ = x, (T) > 0. (17.54) 

Imposons maintenant au système (51) les conditions suivantes 

qui doivent être vérifiées par la solution de (51) à l’instant t = T 
(cf. p. 262) 

Vo (7) = —1, WT) = pp: (T7) =... = nr (T) = 0. (17.55) 


On a, en outre, d’après (54) et (55), 
à W(T) x: (T) = — 6x0 (T)= — 00 LO. (17.56) 
Grâce à (53), l'inégalité (56) peut s'écrire 


—6Q = 25 41 (r) ôxi (r) KO. (17.57) 


L) 
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Jci 
LE (Tr) EE Fp; (4) =+ (è = 0, 1, . + n), 


où + (t) est la solution du système (51), qui satisfait aux conditions 
99 


Les valeurs de Ôzx; (t) (i = 1, ..., n) sont connues (elles sont 
déterminées plus haut par les expressions (42)). En portant ces 
expressions dans l'inégalité (57), on obtient 


2h, u()— fs, w(m)esO. (17.58) 


L'intervalle de temps (t — £, t) est celui où la commande opti- 
male à (t) a été remplacée par une autre commande. En retenant que 
eg >> 0, l'inégalité (58) peut être remplacée par l'inégalité 


D RG, LH) HEC, ÉONEO. (417.59) 


Puisqu'on peut choisir comme + un instant courant quelconque t 
(tb +e<t<T), où e est une grandeur aussi petite que l'on veut, 
l'inégalité (59) peut s'écrire 


ZE, LEZ VE, UE). (47.60) 
Dans ce qui précède (10) nous avons désigné par À la fonction 


des variables CAT . Th Vo: Yu . ns U;, . ee 3, Up 


H (+, Z, u) + à Yu (r, u). 


C'est pourquoi l'inégalité (60) devient 
H (p, z, u) < À (ÿ, z, ü). (17.61) 
Remarquons encore que puisque d’après (30) et (36), 


Ofi (xs u) di ôf: (Z1 Toy cop Tns Ugo ce. uy) _ . 
 —___—_ — = 0 (= 0; 1,:::,7), 


(17.62) 
(51) entraîne que 


Fdho _ 
= 0, (17.63) 


d’où on trouve en vertu de (55) 
VO=—-1 (bo <I<T). (17.64) 
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Nous avons vu ainsi que si la commande à (t) est optimale, on 
a les conditions (61) et (64) qui sont des conditions nécessaires d’op- 
timalité; ces dernières traduisent le contenu du théorème sur la 
condition nécessaire d’optimalité (principe du maximum) du pro- 
blème à temps fixé et à extrémité libre de la trajectoire. 

La démonstration du théorème 1 pour le problème général de la 
commande optimale est donnée dans la monographie [72]. 


$ 18. Principe du maximum pour des systèmes non autonomes 


1. Théorème de la condition nécessaire d'optimalité. Considérons 
le système décrit par les équations différentielles 


dz; 


= 1j (z4, tas Ur sue =) (x, u, t) (18.1) 
(j=1,...,n) 
auxquelles est équivalente l'équation vectorielle 
dz 
7 =Î(z, U, L), (18.2) 


où x, u et f sont les vecteurs 


Ti Us fi(x, u, t) 
| . | -| | f (x, u, »-| ET TT. | (18.3) 
Ln Uy În (x, U, t) 


On demande d'amener le système du point x (£,) de l’espace de 
phase X en un point donné x*. L'instant £, où le point représentatif 
rejoint z* n'est pas fixé à l'avance. 

La commande u = uit) doit vérifier les contraintes 


u € Q; (18.4) 


de plus, le domaine est supposé indépendant du temps. 
En tenant compte des contraintes (4), il faut choisir une com- 
mande w telle qu'elle minimise la fonctionnelle 
t1 


Q = | fo(z(t), u(t), t)dt. (18.5) 
to 
La commande u vérifiant ces conditions, la trajectoire qui lui 
est associée et l'intervalle de temps t: — {, sont considérés comme 
optimaut. 
Comme dans ce qui précède, désignons par zx, (t) la fonction sca- 
laire définie par l'équation différentielle 
0 


T0 — fo (zs, co) Zn Wii, ce.) Ur; t)= fo (x, U, t) (18.6) 
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et par la condition initiale 


ze (4) = 0. (18.7) 
D'après (6) et (7), la fonctionnelle (5) peut s’écrire 
Q = zo (hi). (18.8) 


Introduisons encore la fonction scalaire x, +, définie par l’équation 
différentielle 


dEn+ 
et par la condition initiale 
Tnt (lo) = to: (18.10) 
Il est clair que 
Tn+1 = f. (18.11) 


L'espace des variables x;, ze, . . ., Zn, Tn+1 est désigné par X*. 
Le système d'équations (1) et 


Ener l'équation (6) peuvent s’écrire en com- 
mun 
s dz 

) k, S, = f(x, u, Tnst) 

ee | (j=0,1,..., nr). (18.12) 
là D ; # be 

J TL) | L Voici l'énoncé de notre problème. 
L 2e Chercher la trajectoire optimale qui 
relie dans l’espace X* le point (x, (to), 
Fig. 18.1 La (to), + + + Zn (Lo); to) AVEC un certain 


point de la droite S, (fig. 18.1) qui 
passe par le point (x?, z?, ..., zn, 0) parallèlement à l'axe z,+1. 
Le problème concerné est ainsi ramené à un problème optimal 
autonome à extrémité gauche fixée mais à extrémité droite libre. 
L'’extrémité droite de la trajectoire étant libre, l’application du 
théorème 1 ($ 17) ne peut être immédiate. 
Le système d'équations auxiliaire (17.9) est ici de la forme 


d : à  U, t . 
In — — > LE 4 (k—=0,1,...,n), (18.13) 


i— 


n 
dhn+ fi (x, U, t) 
i=0 


Introduisons la notation analogue à (17.10) 


À (+, ZT, À, = À vif (z, u, t). (18.15) 
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Les équations (12) et (13) peuvent se mettre sous la forme 


dry _ OA di 0H 


dt — OÙ ? dt ÔZ; 

La condition nécessaire d’optimalité d’un système non autonome 
est donnée par le théorème qui suit. 

Théorème (principe du maximum pourdles 
systèmes non autonomes [72]. Soit u (t) (LL) 
une commande. admissible telle que la trajectoire qui lui est associée 
z (t) du système (1), issue à l'instant t, du point x (t,), passe à l'instant 
t, par le point x*. Pour que la commande u (t) et la trajectoire x (t) 
soient optimales, il faut qu'il existe un vecteur fonction continu non nul 
Ÿ (4) = (bo (£), 1 (4), - . ., Wn (t)), associé aux fonctions u (t) et x (1) 
tel que 

1°. Pour tout instant t (t) Lt L t:), qui est un point de continuité 
de la commande u (t), la fonction H (b (t), x (t), t, u) de la variable 
u E Q atteint au point u = u (t) le maximum 


HO, z(,tu(t)) = M(p(t), ze), th (18.17) 
2°. Les relations 


(i=0,1,...,n). (18.16) 


Vo (?) = const < 0, (148.18) 


t n 
M, z(0, D= [ D 'HEOEOLN 4, (a (18.19) 
ty i—1 
soient remplies. 

Il s'avère ensuite que si les fonctions % (t), x (t), u (t) vérifient le 
système (12), (13) et la condition 1°, la fonction 1, (t) de la variable t est 
constante, et la fonction M (1 (t), x (t), t) ne peut différer de l'intégrale 
de (19) que d'une constante ; il suffit donc que les relations (18) et (19) 
soient vérifiées à un instant quelconque t (t Lt L l;); par exemple 
au lieu de (18) et (19), il suffit de vérifier les relations 


Yo) <0, Mb), zu), à) = 0. (18.20) 


La comparaison du théorème qui vient d'être énoncé avec le 
théorème 1 ($ 17) montre que pour les systèmes non autonomes décrits 
par les équations du type (1), le principe du maximum est également 
vrai. 

La différence ne consiste que dans le fait que pour les systèmes 
non autonomes la fonction 


M GO, z 0), D = À, x (0, £, u (0) 


n'est plus constante, étant définie par l'expression (19). 
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2. Démonstration du théorème de la condition nécessaire d'opti- 
malité d’un système non autonome à entrée linéaire de la commande. 
Pour le cas particulier d’une entrée linéaire de la commande on peut 
donner une démonstration immédiate du théorème de la condition 
nécessaire d’optimalité d’un système non autonome [27, 72]. 

Examinons le système régi par les équations différentielles 
scalaires 


efface ns D+ D Bn(u (=... nr) (18.21) 


l=1 
auxquelles est équivalente l'équation différentielle vectorielle 


= f(x, 1)+B(u, (18.22) 
où 
Ti | fa (x, t) 
[7 CES A 
Fn În (5, t) (18.23) 
But) ... Bar(t) Lu 
2-| nee | [| 
Bit) ... Bnr (t) Ur 


I1 faut faire passer le système du point zx (ft) au point donné z*. 
L'’instant t, où le point représentatif tombe en z* n'est pas fixé à 
l'avance. 

Les commandes vu, (t) doivent vérifier les contraintes 


Qui CO | << ma, (—=1,...,7r), (18.24) 


et il faut les choisir telles que le système soit amené en z* en mini- 
misant la fonctionnelle 


{1 r | 
Q— | [ fo (z (0), 1) + S Boi(t)u | dt. (18.25) 
to 1=1 

Désignons par zx, ({) la fonction définie par l'équation différen- 
tielle 


0 — fo (x, os, Tn: t)+ > Bi (4) U} (£) (18.26) 


I=1 
et la condition initiale 
To (to) = 0. (18.27) 


La fonctionnelle Q se met alors sous la forme 
Q — Lo (1). (18.28) 
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Les variables auxiliaires 4,, 1, - . ., WA vérifient le système d’équa- 
tions différentielles 


n 


= _ 5 En nent, (k—0,1,...,n). (18.29) 


k 
i=0 
Dans le problème considéré la fonction À s'écrit 
n r 
H = Da Cfa (as, +, Zn, t)+ 2 Bu (£) ui] 


ou 
H= D vif: (tas ce Zn + 2 U, (2 Bu (el. (18.30) 


Désignons par à (t) la commande optimale, par x (t) et d(t) les vec- 
teurs des coordonnées de phase et des variables auxiliaires qui lui 
sont associés. 

Montrons que la commande optimale aura la forme suivante qui 
correspond au théorème du principe du maximum 


U, (£)= m, sign À Bu Ÿ: (4) (l=1,...,r) (18.31) 


ou 
ui(t)=msign Rift)  (L=1,...,r), (18.32) 
avec 
R(t)=B"(t)d(E), (18.33) 
Bot (t) ... Bor(t) Vo (4) 
= By (t) ... Bir(t) , Ÿ()=— LIROE E (18.34) 
Bni (t) -.. Bar(t) da (£) 


Donnons à la commande optimale à, (t) l'accroissement ôu, (£) qui 
vérifie la condition 


| dr (t) + ôur (D | <m: LOS PRE à P (18.35) 

Appelons la fonction Ôôu, (t) variation admissible de la commande 
optimale. 

A la commande ü, (4) + ôu(t) (? = 1, ..., r) correspond la 

solution z4 (t) + Ôôxx (t) (k = 0, 1, ..., n) des équations différen- 


tielles (21) et (26), où x, (?) (4 = 0, 1,...,n) est la solution de ces 
équations pour uy(t) = &i(t) (1 =1, ...,r). 
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L'état initial du système xs (fo), z1 (to), + - +; Zn (to) étant fixé, 


il vient 
Ôzy (to) = 0 (4 = 0,1,...,n). (18.36) 
Ainsi, suivant (21) et (26), on a le système d'équations différentielles 


(Es ô7) = f5(r1+ Or, ... Tn + Ôtn; t) + 


+ D Ba(t) (us + ôu) (j—=0,1,...,n). (1837) 
Comme ds 


fi(ti + ô2s, ..., In HôZn, t)= 


= fjfti .., En EP ous ou 
+ 0 (Ôto, Ôxs, ..., Ôxn) (j=0, 1,..., nr), (18.38) 
les équations (37) deviennent 


dy, d © 
+ ôzs= fj(x, ..s Tn: t)+ © Ba(t)u+ 
I=1 


- G) 7 9 ces En, . 


(j=0,1,..., n). (18.39) 


Comme il résulte des relations (21) et (26), le premier terme du 
premier membre de l’équation (39) se réduit avec les deux premiers 
termes du second membre de ces équations. Dans le cas de petites 
variations admissibles de la commande ôu, (t), les variations Ôz, (t) 
(1 = 0, 1, ..., n) seront également petites. Alors, en négligeant 
dans les équations (39) l’ensemble des termes du deuxième degré et 
des degrés plus élevés par rapport à ôx,, ôx;, . . ., ôx,, on obtient le 
système d'équations différentielles linéaires 

n " “ r 
Lx; D Er En 0) 57, + S' Bjr (t) Eux (t) (18.40) 


OTh 
h=0 lt =1 


(j=0, 1,..., n). 
Les équations (40) représentent un système d'équations aux variations 
du problème considéré. Puisque 2, (4), . .., x, (t) déterminent la 


D. : fils Tnt : 
trajectoire optimale, les fonctions HE En 0 sont certaines fonc- 


tions du temps. 
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Désignons par À (t) la matrice (n + 1) X (r + 1) dont les élé- 
ments sont les fonctions PE = End , 


Th 
ôfn fo fo do 
079 Ôz: OZ» On 
[oh oh oh ot 
A(t)=| 70 Ôzi. Ôre ‘°° den |. (18.41) 
0fn ôfn 0fn 0fn 


020 OZ ze ‘‘ Orn 
Introduisons la notation E pour le vecteur de dimension (#7 + 1) 


Éo 
E— 5 (18.42) 
En 
où 
Es = 07 (G—0,1,...,n). (18.43) 


Le système d'équations aux variations peut être mis sous la forme 
de l'équation différentielle vectorielle 


E=A()E+B(Dôu(,  Elto) =0, (18.44) 
où la matrice B (t) est de la forme (34). 


La matrice A* (£) construite par transposition de la matrice (41) 
s'écrit : 


7 9/0 0f fo Ofn — 
OZo UX9 0x0 ne OT 
fo of: Üfo Ofn 
A* (t) == OZ ; CEA Oz: IT! (18 45) 
010 Of, Oo Ofn 
_0Zn ln En  Orn 


D'après (29), les variables auxiliaires 140, Ÿ1, . . ., W, associées à 
la commande optimale à, (t) vérifient le système d'équations diffé- 
rentielles 


di 0 Zi se. Env t) 2 
Er À (k=0,1,...,n). (18.46) 


i=0 
Ce système peut être remplacé par l'équation différentielle vectorielle 
d a a 
7 Ÿ= — A*(t)Ÿ. (18.47) 


17-0393 
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Désignons par & ({) la matrice fondamentale des solutions de 
l'équation différentielle vectorielle (47) vérifiant la condition 
E (to) = E, où E est la matrice unité. 

Par A (t) désignons la matrice fondamentale des solutions de 
l'équation différentielle vectorielle 


= A()E, (18.48) 
qui satisfait à la condition A (1,) = E. 
Comme d’après (47) et (48), 
FU, L= LH DE, LDH, FH EU)= 
=(— 4° (1) D), EG)D+C(), AE) = 
= —Ÿ (HAE +P DA(DEU=0, (18.49) 
il vient 
Gb (4), 6 (#)) = const, (48.50) 
d’où l’on déduit que 
Gp (2), E (D) = Gb (to), E (40) )- (18.51) 
En remplaçant 1 (t) et &(t) par les solutions des équations (47) 
et (48) 
Pt = E (Dpt), 6 (9) = A (8 E (to), 
on réduit la relation (51) à la forme 


LE (9 Ÿ (t0)1* A (1) & (to) = Ÿ* (to) E (40) 
d* (to) E* (4) A (0 E (to) = D (to) E (to). (18.52) 


La relation (52) entraîne 
E+ MH A(D=E, E*(t) = AT(b). (18.53) 


En transposant les matrices du premier et du second membre de 
(53), on obtient 


ou 


AS(DED=E, A*(h = ET(b. (18.54) 
D'une façon analogue à (49), on trouve des équations (44) et (47) que 
(4), (0) = (B* (4) (1), Ou (4), (18.55) 


d'où, en intégrant, on obtient 


ls 
EG), PCA) —E (Go) PU = | (B* (x) DT), (rh dr. (18.56) 
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Puisque d’après (44) E (4) = 0, la relation (56) devient 
ti 
EG), bte | (B*(r) DR), Gu(r)dr. (18.57) 
lo 
Montrons que si la condition (31) est respectée, on a la relation 
(Œ (4), D (4)) KO, (18.58) 


où E (£,) est un vecteur quelconque de l’ensemble des vecteurs as- 
sociés à l’ensemble des variations admissibles Ôu (t). 
En effet, conformément à (31), pour 


LBEn@h>0 (El, IE lo H]) 


on a ë,(t) =m,(tElt*, t**]) et la variation admissible ôu, (t) 
satisfait à la condition 


—2m, < ôu, (t) < 0. 


Pour 
x Bio (£) Ÿi (£) < 0 (£ € [£,, lux] (es [£os t1]) 
on a, d’après (31), à, (t) — —ms(t € Lt, 1..]) et la variation admis- 


sible satisfait à la condition 


0 < ôu, (t) < 2m. 
De plus 


{1 
| (B* (x) (x), ôu(r)) dr <O, 
to 


d'où l’on déduit d’après (57) la relation (58). 
On voit également sans peine que si la condition (31) n’est pas 
observée, il existe des variations admissibles telles que 


(E (4) D (4)) > 0. 


En effet, supposons qu’en dehors de l'intervalle de temps [t*, 4**] & 
€ [to ti), la variation de la commande ôu (t) = 0. Dans l'intervalle 
de temps [t*, 4**] 


ôu, (4) 0, Ou, (t) = 0 G=1,..., p—1,u+1,...,7r). 


Soient 
ñn 


À Ban (9 (1) >0, w( my (PEL, #97), 


c'est-à-dire la condition 31) n’est pas remplie. 
17* 
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Choisissons comme variation admissible de la commande 
ôu, (t) =v>0 (EE, 4%+)), | 
où v vérifie la condition 
u,(t+v<m, (EL, 1%). 
L'expression (57) se met alors sous la forme 


tes n 
Et), bn= [TD But bito var >0. 
t#  i-0 


Ainsi la relation (58) n’a lieu que si la condition (31) est observée. 
Les variations admissibles ôu (t) de la commande optimale doivent 
vérifier la relation (35), dont il résulte que les vecteurs Ôu (t) sont 
bornés en norme. Puisque nous partons du système linéaire d'équations 
aux variations (44), nous nous bornerons aux variations ôu (t) suffi- 
samment petites vérifiant aussi bien la condition (35) que la con- 


dition 
[ôu; () |<Le Et, 553 0), (18.59) 


où & est une grandeur suffisamment petite. 

A chaque variation admissible ôu (t) correspond une solution 
E (4) de l'équation différentielle vectorielle (44). A l'instant £,, cette 
solution prend la valeur Ë (£,). Dans l'espace (xç, 21, . . ., z,) de di- 


mension (7 + 1) menons à partir du point x (#;) = (zo (t), z (t1)) 
le vecteur E (4). Appelons l’ensemble des extrémités des vecteurs 
E (11) associés aux variations admissibles ôu (t) ensemble d'atteigna- 
bilité et désignons-le par X (t,). Puisque d’après (59) les variations 
admissibles ôu (t) sont bornées, les vecteurs & (4,) le sont également 
et, par conséquent, l’ensemble Æ (£,) est borné. 

On peut montrer que XÀ (f,) est un ensemble convexe. A cet effet 
il faut que tous les points 


(1 — À) EF (4) + AË*# (4)  (O<A<1) 
- du segment de droite reliant les deux points E*(£,) et E**(4,) de l’en- 
semble X (t,;) appartiennent à cet ensemble. Les variations de la 
commande ôu* (f) et ôu** (t) auxquelles correspondent E* ({,) et 
E** (4) vérifient les conditions (35) et (59). Définissons ôu, (1) 
(€ [to, 11) par la relation 

Ou (4) = (1 — À) Ou (4) + Aôu** (1) (OS À LH). 


La variation de la commande Ou, (t) satisfait aux conditions (35) 
et (59), c'est-à-dire le point E, (4) € K (t,). La solution E, (4) qui 
correspond à la variation ôu, (t) et à la condition initiale E; (4,) = 0 
est, en vertu de (44), 


t 
En (4) = A (6) | At (T) B (tr) ôu (tr) dr = 
lo 


$ 18] SYSTÈMES NON AUTONOMES 261 
ZT 


t . 
= (1— 2) AU) | AT (r) B(R)ôu* (D dr + 


to 


t 
+ AA (e) À A1 () Br) Gu** (re) de = (1— DE" (0) 4 AE (0. 
t 


On en déduit que 


Ex (4) = (1 — À) EX (4) + AËTS (4); 
K (t,) est donc un ensemble convexe borné. 


Montrons encore que le point x (4) = (zo (4), x (/1)), associé à la 
variation ôu({) = 0 (1€ [to, til), est situé sur la frontière de l’en- 


semble À (£,). En effet, le point z (t,) de l'espace . 2 552 4) 
repose sur la droite L qui passe par le point (O, EZ (£),  Tn (£1)) 
parallèlement à l'axe z,. Si le point (to (1), Zn (ds +. En (4) 


était un point intérieur de l'ensemble"convexe borné K (4); il exis- 
terait un segment L* de la droite L d'extrémité (x (4), ï (4), . 

+ Zn (t)), dont tous les points appartiendraient à l'ensemble 
K (4) et auraient la coordonnée zx,, plus petite que la coordonnée 
zo (t1) du point frontière de la trajectoire optimale. Alors, une “sphère 
de rayon p assez petit et de centre (Zo (ta), Zn (ds + … En (t)), dont 
tous les points appartiennent à l’ensemble Æ (1) couperait le seg- 
ment L* au point (x, x, ({3), ..., 2h (4)), où 26 < To ut ce qui 
contredirait l’optimalité de la rniéctois e(zo (t), 1 (6), . .., 2n (t)) 
(tE Lto, 4)). 

Il s'ensuit que le point x (4) = (xo (#1), x (/)) appartient à la 
frontière de l’ensemble convexe borné X (4;). 

On sait [15ljque par tout point frontière d’un ensemble convexe 
no deut mener au moins un hyperplan tel que tous les points de cet 
ensemble se:situeront d'un seul côté de cet hyperplan. Cet hyper- 
plan est dit. hyperplan d'appui. Par un point frontière anguleux on 
peut mener plus d’un hyperplan d'appui. Désignons par M l'hyper- 
plan d'appui de l’ensemble Æ (£,;) passant par le point frontière 
z (t;) = (Zo (), z c (4). Désignons par W la normale unité à l’hyper- 
plan M en x (&) = (z0 (4), x (4)), dirigée dans le demi-espace ne 
contenant pas d'ensemble Æ (4). De ce qui vient d’être dit il en 
résulte que pour, tout vecteur Ë (41) € Æ (£,) on a la relation 


Œ (4), ND 0. (18.60) 


Pour achever la démonstration du théorème, il faut démontrer 
l'existence d’un vecteur fonction ‘ ({) vérifiant la condition (17). 
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Posons 
DH) = NN. (18.61) 


Alors, comme nous l'avons montré plus haut (relation (58)), pour 
remplir la condition (60) il faut que la commande à (t) soit définie 


par la formule (31), où + (t) est la solution du système d'équations 
différentielles (46) vérifiant la condition aux limites (61). 

Remarquons à titre d'exemple que pour un problème à temps fixé 7 et à 
extrémité libre de la trajectoire le plan d'appui M de l’ensemble d’atteignabi- 
lité X (T) est perpendiculaire à l’axe z,. C’est pourquoi la normale # au plan M, 
dirigée dans le demi-espace ne contenant pas d'ensemble Æ (T7), est N = (—1, 
0, ..., O0) et, par suite, d'après (61), dans ce problème 14 (7) = (—1, 0, ... 
.-., 0), comme l'indique la formule (17.55). 


Les raisonnements exposés ici à l’aide des équations linéaires 
aux variations (44) sont vrais si les variations Ou (t) sont assez pétiles, 
c'est-à-dire si l’on n’étudie que les trajectoires assez proches de la 
trajectoiré optimale. 

Ainsi nous avons démontré que la condition (31) est une condi- 
tion nécessaire d'optimalité. 

La question des conditions "suffisantes d’optimalitéTsous la forme 
du principe du maximum impose une étude"spéciale. 

3. Systèmes linéaires non autonomes. Réduction du problème 
de la réponse en temps minimal à un problème aux limites. Intro- 
duisons au préalable quelques'notations. Considérons deux systèmes 
décrits par les équations différentielles vectorielles 


À = A(HDE, (18.62) 
d , 
= — A* (in, (18.63) 


où la matrice A* (t) est la transposée de À (t). Désignons par 8 (6) 
la matrice fondamentale ‘des solutions de l’équationf(62), et par 
X (t) la matrice 


X (t) = 6 (t) 6-! (0). (18.64) 
La solution du problème de Cauchy pour l'équation différentielle 
vectorielle (62) est 
E (4) = X (4) & (0). (18.65) 
La solution du”problème de Cauchy pour l'équation vectorielle 
(63) s'écrit 
n () = E (+) n (0). (18.66) 
Ici € (t) est une matrice carrée qui satisfait à la condition 
& (0) = £, (18.67) 


où E est la matrice unité. 


$ 18] SYSTÈMES NON AUTONOMES 263 


Comme nous l'avons montré précédemment (53), les matrices 
X (t) et Z (4) vérifient la condition 
Er (D = XX" 0). (18.68) 


Considérons maintenant le système de commande décrit par 
l'équation différentielle vectorielle 


= A()r+B(tu, (18.69) 


où x, À (t), B (t}), u sont les matrices 


CURE Uy 
et | | "| 
rene Le 
TA (4) ... Ain (6) 
AD=l Es SE eu : (18.70) 
An1 (#) ... Ann (4) 
"Bu (€) ... Bi, (t) 
E}=| SR sSerssRa 
Bat)... Bnr() | | 


L'équation Vécoielle (69) est nr Le au système d’équa- 
tions _ 


di = _S An (é) a+ BnOu (j—1,..., n). (18.71) 


k=1 I=1 
Les commandes zu, sont soumises aux contraintes 
—1 Lu, Li (=1,...,7r). (18.72) 


On demande de faire passer ce système en un temps minimal du 
point x (0), où le système se trouve à l'instant t, = 0, au point x = 0. 
Désignons par le vecteur de dimension n 
Vi |. 
Pl: (18.73) 
ns 


et introduisons d'après (15) la fonction 
H (+, z, u)= à à sd ju (€) Ta +2 u(2 ÿBj(t)). (18.74) 
ti = — 


En vertu de (13), les fonctions 4; (j = 1,...,n) vérifient les équations 
différentielles 


MES AU G=1,..., n), (18.75) 


Rai 
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équivalentes à l’équation différentielle vectorielle 


di ’ 
= A (D. (18.76) 


Conformément au théorème du principe du maximum, la com- 
mande optimale a pour expression 


U, G)=sign 2 Bjilt) (té)  (L=1,...,r). (18.77) 
Les relations (77) peuvent s'écrire 
u,(t)=sign R,(t) (lt; 7), (18.78) 


où par À (t) on désigne le vecteur de dimension r qui est le produit 
des matrices 


R (t) = B* (t)w (1). (18.79) 
Introduisons la notation Ÿ ({) pour la matrice 
Y (4) = X7!(1)B (+). (18.80) 
Comme en vertu de (66) et (63), la solution de l'équation vectorielle 
(76) est 
D (4) = E (1) Ÿ (0), (18.81) 


l'expression (79) peut s’écrire, compte tenu de (68), 


R (1) = B* (4) E (1) (0) = LE* (2) B (1]* + (0) — 
= [X-1 (4) B (4)I* (0) = Y* (4) y (0). (18.82) 
D'après (82), les éléments du vecteur À ({) sont 


R; = 2 Ya (#2) b;(0) (—=1,...,r). (18.83) 
De cette façon d'après. (78) et (83), la commande optimale est 
U, G)=sign 2 Yu) (0)  (=1,...,r). (18.84) 


Ecrivons maintenant la solution du problème de Cauchy pour l’équa- 
tion vectorielle (69) 


t 
z(t)=X(t)z(0)X (1) | X-1(T)B(t)u(r)dt. (18.85) 
0 


Désignons par £, l'instant où le système (69) est recalé à l’origine 
z (tr) = 0. (18.86) 
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Conformément à (85), (80) et (86), on a 
{1 
X (4)z(0)+ X (4) | Y(thu(r)dr=z(n)=0. (18.87) 
0 


Comme la matrice X (t) est régulière, (87) entraîne la relation 


t1 
z(0)=— | Y(Hu(r)dr. (18.88) 
0 
La relation vectorielle (88) est équivalente aux relations scalaires 
r  fÎ! 
xs (0) = — > | Yul(t)u(t)dt  (s=1,...,n). (18.89) 
l=1 0 


En remplaçant u,(t) par la commande optimale (84), ramenons les 
relations (89) à la forme 


r,(0)= — | Far) [sign D Ya(r) s(0)]dr  (s=1,..., n). 


={ Ù J=1 
(18.90) 


Dans les relations (90) les inconnues sont les grandeurs 1, (0), ... 
. + Ÿn (0), ainsi que la valeur de l'instant f£,, où le système atteint 
l'origine des coordonnées. 
Les équations (90) sont les équations initiales pour certaines 
méthodes numériques de recherche de la commande optimale. 


$ 19. Problème à extrémités libres. Application 
du principe du maximum. 
Conditions de transversalité 


Il existe des problèmes dans lesquels l’état final du système est 
donné sur un ensemble M, (plan, ligne, etc.) de l’espace de phase, 
et non pas sous la forme d’un point fixé de cet espace. Ainsi, par 
exemple, des problèmes sont possibles dans lesquels à l'instant final 
t, seules les coordonnées de phase du système zo,, Zos, : . ., Zo:, pré- 
sentent de l'intérêt. Les autres r — p coordonnées de phase peuvent 
avoir à l'instant final #, des valeurs arbitraires. 

Des problèmes sont également possibles dans lesquels l’état 
initial x ({,) n’est pas donné à l’avance et on sait seulement quele 
point zx (ét) appartient à l’ensemble M, de l’espace de phase. 

On tombe ainsi sur le problème optimal à extrémités libres dont 
les solutions obtenues dans la monographie [72] seront exposées 
dans ce qui suit. 
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Avant de donner la formulation exacte du problème, il convient de mettre 
au point les caractéristiques géométriques des ensembles M, et M, susmention- 
nés [72]. Soit X un espace de dimension n aux coordonnées orthogonales z,, . .. 

+ Zn°. L'ensemble S des points z = (z1, ..., x,) vérifiant la relation 


fan. 2) = 0, (19.1) 


s'appelle hypersurface de l’espace X, et la relation (1) est dite équation de cette 
hypersurface. Le point x € S qui satisfait aux relations 


f(x) __9f(x) _ _of(x) _9 
Oxy Oz ‘‘” zn 
(on suppose que les dérivées ZLrexistent) s'appelle point singulier de l'hypersur- 


face S. Ainsi, en un point singulier le vecteur 


ad ft= (4e, 20 2) \ 


* ze °° zh 


nul. Les points de l'’hypersurface S où grad f (x) 0 s'appellent points régu- 
iers. 
L’'hypersurface définie par l'équation (1) au premier membre continûment 
dérivable et ne possédant pas de points singuliers s'appelle hkypersurface lisse. 
(Toutes les hypersurfaces étudiées dans ce qui suit sont supposées lisses.) 

Si l'équation (1) est linéaire, c’est-à-dire si elle est de la forme 


Gti + ao +... + ar + b = 0, (19.2) 


l'absence de points singuliers signifie qu’au moins un des coefficients a, est diffé- 
rent du zéro. Dans ce cas l’hypersurface, définie par l'équation (2), s'appelle 
hyperplan. 

Le vecteur grad f (r°) se nomme vecteur normal à l'hypersurface S au point 
2°. Comme on le voit de (2), dans le cas d’un hyperplan, les vecteurs normaux 
sont les mêmes en tous les points et ont la forme 


(a, day an): 


Tout hyperplan est défini univoquement par un vecteur normal et un point 
appartenant à ce plan. 

Soit S une hypersurface lisse définie par l'équation (1), et z° un de ses points. 
L'hyporplan qui passe par le point z° et dont la normale est le vecteur 
grad f (x°) est dit hyperplan tangent à l'hypersurface S en z°. Tout vecteur issu du 
point z° situé dans l'hyperplan tangent s'appelle vecteur tangent à l'hypersurface 
S au point z°. 

Soient maintenant S1, ..., S, des hypersurfaces lisses données dans l'es- 
pace X par les équations 

A (Zu: Las . z:) — 0, | 
ÎR (Zur Zos + +. Zn) = 0. 


(19.3) 


Si l'on observe la condition suivante: en chaque point x € M les vecteurs 


grad fi (x), grad f2 (x), . . ., grad fx (z) (19.4) 


sont linéairement indépendants, l'intersection M de toutes les hypersurfaces (3) 
(c'est-à-dire l’ensemble de tous les points z € X vérifiant à la fois toutes les 
équations (3)) s’appelle variété lisse de dimension (nr — k) dans X. 
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Constatons que, par définition, la variété de dimension r dans X cst donnée 
par le système de n — r équations. En particulier, la variété de dimension 
(n — 1) est donnée par une équation de la forme (3), c'est-à-dire c’est une hyper- 
surface. Les variétés à une dimension sont données par n — 1 équations de la 
forme (3) ; on les appelle également lignes. 

Si les équations (3) définissant la variété M de dimension (nr — X) sont linéai- 
res, la variété M s'appelle plan de dimension (n — k) de l’espace X. Les plans 
à une dimension s’appellent également lignes droites. 

Soit 4 une variété lisse de dimension (r — k) définie dans l'espace X par 
les équations (3), et x un de ses points. Désignons par L; (i = 1, ..., k) 1'hy- 
perplan tangent à l’hypersurface f; (x1, ze, . . ., zh) — 0 au point x. L’inter- 
section des hyperplans L;, L:, ..., L, est un plan de dimension (n — k) a 
pelé plan tangent de la variété M en x. Le vecteur issu du point z repose dans le 
plan tangent (c’est-à-dire constitue un vecteur tangent à la variété M en x) si et 
seulement si il est orthogonal à tous les vecteurs (4). 


Maintenant on peut donner l’énoncé exact du problème optimal 
étudié. 

Soient M, et M, des variétés lisses de dimensions arbitraires ro 
et r, (mais plus petites que n), situées dans l’espace X (fig. 19.1). 
On demande de trouver la commande 
admissible u ({) qui ramène le point 
représentatif d’une position (non don- 
née à l’avance) z° € M, à une position 
x* E M, et minimise la fonctionnelle 
donnée. 

Dans le cas où les deux variétés 
dégénèrent en points, le problème aux Fig. 19.1 
extrémités libres se transforme en un 
problème aux extrémités fixées. 

Remarquons que si nous connaissions les points 2° et z*, nous 
aurions un problème aux extrémités fixées. C’est pourquoi la com- 
mande uw (t), optimale pour le problème à extrémités libres, est 
encore optimale pour le cas où les points r° et x* sont considérés 
comme connus, c’est-à-dire que le principe du maximum (théorème 1, 
p. 243) est également valable pour le problème à extrémités libres. 

Cependant, il faut encore connaître les relations qui permettent 
de déterminer la position des points z° et z* sur les variétés M, et 
M,. Ces relations sont les conditions de transversalité qui permettent 
d'écrire ro + r, relations où interviennent les coordonnées des ‘points 
d'extrémité x° et z*. 

Constatons que le nombre de paramètres inconnus (par rapport 
au problème à extrémités fixées) s’est également accru der, + r; 
du fait que la position du point zx° sur la variété M, est définie par 
r, paramètres, alors que celle du point z* sur la variété M, par r, 
paramètres. 

Voici les conditions de transversalité. Soient x° € M,, z* € M, 
des points, et Z,, T, les plans tangents des variétés M, et M, menés 
par ces points. Les dimensions des plans 7, et 7, sont r, et r, res- 
pectivement. 
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Soient u (t), x (t) (to Lt Lt,) la solution du problème à extré- 
mités fixées 2° et x*, et + (t) le vecteur dont l'existence est démontrée 
par le théorème 1 (p. 243). 

La condition de transrersalité à l'extrémité droite de la trajectoire 
x (t), c’est-à-dire au point x (t;), consiste dans le fait que le vecteur 
Ÿ (4) = (bi (41), Vo (1), + + +, Vn (t1)) est orthogonal au plan T.. 
Autrement dit, tout vecteur 96 = (6,, 6., ..., 6,) appartenant au 
plan T7, vérifie la relation 


(tp (4), 8) = 0. (49.5) 


La condition de transversalité à l’extrémité gauche de la trajec- 
toire x (£) a un sens analogue (il ne faut que remplacer £, et 7, par 
to et To respectivement). 

Comme dans la relation (5) on ne peut substituer que r, vecteurs 
linéairement indépendants 6,, 6., ..., 6, situés dans le plan T,, 
la condition de transversalité à l’extrémité droite de la trajectoire 
x (t) donne r, relations indépendantes. La condition de transversalité 
à l'extrémité gauche donne r, relations indépendantes. 

Ainsi, le théorème suivant a lieu se 

Théorème. Soit ut) (4 Lt <t,) une commande admissible 
qui ramène le point représentatif d'une position x° € M, en une position 
z*CM,etx(t), la trajectoire correspondante issue du point x°=(zx,,x,, … 
. ++ Zn). Pour que u (t) et x (t) donnent la solution du problème opti- 
mal, il faut qu'il existe un vecteur fonction non nul continu 1 (t) véri- 
fiant les conditions du théorème 1 (p. 243) et de plus, la condition de 
transversalité à deux extrémités de la trajectoire x (t). 


$ 20. Notion de synthèse régulière dans la théorie 
des systèmes optimaux 


La notion de synthèse régulière a été introduite par V. Boltianski 
[14] pour un système régi par les équations différentielles (17.1) 


dz | 
= f; (2 .. Lni Us ur) =: ...7 n); 


ou par l'équation vectorielle équivalente 


= f(x, u), (20.1) 
avec u € 2 et les dérivées 
0f} of; se LL 
7 ms Vis... n k=t,...sr), 


supposées continues. 
Supposons donnés un ensemble À lisse par morceaux (cf. $ 15, 
p. 231) de dimension <n — 1, des ensembles lisses par morceaux 


PEePrerPe.: el re Pl" =D (20.2) 
et la fonction v (x) définie dans D et prenant des valeurs dans Q. 
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_ Si les conditions suivantes’ énoncées par V. Boltianski sont vé- 
rifiées, les ensembles (2) et la fonction v (x) réalisent une synthèse 
régulière de l'équation (1) dans le domaine D. 

A. L'ensemble P° contient le point a = r* et ne possède pas de 
points d’accumulation dans l’ensemble ouvert D. Toute composante 
de l’ensemble P'X (P'-1 |] N) (i = 1, 2, ..., n) est une variété 
lisse de dimension à dans D ; ces composantes s'appellent cases de 
dimension i. Les points de l’ensemble P° s'appellent cases de dimen- 
sion nulle. La fonction v (x) est continue et continüment dérivable 
dans chaque case et peut être prolongée en une fonction continüment 
dérivable dans le voisinage de la case. 

B. Toutes les cases sont rangées en première et deuxième espèces. 
Les cases de dimension n sont de première espèce, les cases de 
dimension nulle sont de deuxième espèce. 

C. Si © est une case de dimension à de première espèce, par tout 
point de cette case passe une seule trajectoire de l’équation 


dj (es v{x)) 20.3 


Il existe une case IT (o) de dimension (i — 1) telle que toute trajec- 
toire du système (3) qui passe par la case ©, la quitte après un temps 
fini en butant sous un angle non nul contre la case IT (0) et en s’ap- 
prochant de cette dernière avec une vitesse de phase non nulle. Si © 
est une case à une dimension de première espèce, elle présente un 
morceau de trajectoire de phase du système (3) qui s'approche avec 
une vitesse de phase non nulle d’une certaine case IT (o) de dimen- 
sion nulle. 

Si & est une case de dimension i de deuxième espèce, différente 
du point a, il existe une case © (o) de dimension (i + 1) de première 
espèce telle que d’un point quelconque de la case o est issue 
une seule trajectoire du système (3) qui passe par la case © (o); 
de plus, la fonction v (x) est continue et continüment dérivable sur 
ol © (o). 

D. Les conditions énoncées ci-dessus rendent possible le prolon- 
gement de la trajectoire du système (3) d’une case à l’autre: de la 
case © à la case IT (o), si la case IT (o) est de première espèce, et de 
la case © à la case Z (IT (o)), si la case IT (o) est de deuxième espèce. 
Il faut que chacune de ces trajectoires ne passe que par un nombre 
fini de cases (c’est-à-dire que le « perçage » des cases de deuxième 
espèce ne s'effectue par chaque trajectoire qu’un nombre fini de fois). 
De plus, toute trajectoire se termine au point a. 

Les trajectoires de ce type sont dites marquées. 

Ainsi de chaque point de l’ensemble D X N part une seule trajec- 
toire marquée qui mène au point a. Il faut également que de chaque 
point de l’ensemble N parte une trajectoire (non unique, si possible) 


du système (3), qui mène au point a et qu'on appelle également 
marquée. 
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E. Toutes les trajectoires marquées vérifient le principe du 
maximum. 

F. La valeur de la fonctionnelle Q (cf. (17.3)), calculée le long 
des trajectoires marquées (qui se terminent au point a), est une fonc- 
tion continue du point initial x (6). 

En particulier, si plusieurs trajectoires marquées sont issues du 
point x (fo) E N la valeur de la fonctionnelle Q est la même pour 
toutes ces trajectoires. 

Exemple de synthèse régulière. Problème de la réponse en temps 
minimal dans un système linéaire. Tous les exemples connus de 
synthèse d’une commande à temps optimal dans les systèmes linéai- 
res sont des cas particuliers de synthèse régulière. 

Montrons-le sur l'exemple relativement simple du système liné- 
aire du $ 15, p. 227. 


Les équations du mouvement de ce système s'écrivent 
dz; dz 


ps nr —— 9 
a & (20.4) 
La commande u subit la contrainte 

—1<u<i1. (20.5) 


On demande de ramener le système de l’état initial donné z (t,) à l'état 
z = O0 en un temps minimal. . 

L'intervalle de temps pendant lequel on réussit à recaler le système à l’état 
z = 0 dépend essentiellement des contraintes imposées à la commande uw: 
[u|< 1. 

Conformément à (1) et (4), dans notre exemple, 


f\(œ u)= 2e, far u) = u. (20.6) 
D'après (17.21), la fonction Æ se met ici sous la forme 
H = Vo + Yau, (20.7) 
où, en vertu de (17.23), #. et Ÿ. vérifient les équations différentielles 
di dipe _ 
SR Um (20.8) 


I1 ressort de l'expression (7) que pour un instant quelconque t, sous la 
contrainte (5), la valeur maximale de la fonction A (Ÿ (t), x (t), u) de la variable 
u, où | u | < 1, est donnée par la commande de 


u (t) = sign 1: (t). (20.9) 
Ainsi, d’après (9), la commande optimale est 
u (t) = 1 pour 1. (t) > 0, u (t) = —1 pour as (t) < 0. 
D'après (8), les fonctions 4, (£) et ÿ. ({) sont de la forme 
Wa (6) = Va (to); De (E) = — V1 (to) (E — to) + a (Lo), (20.10) 


où par 41 (fo) et Ÿe (to) on désigne les valeurs initiales des fonctions 4, (t) et 
%2 (t) respectivement. 
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Si les valeurs initiales ÿ: (to) et %s (to) étaient connues, alors, en vertu de (9) 
et (10) le A de synthèse de la commande optimale serait résolu. La re- 
cherche de la valeur initiale 4 (£.) du vecteur fonction % (t) constitue la plus grande 
difficulté du problème général de synthèse de la commande optimale par rap- 
port au principe du maximum. 

Dans notre exemple bien simple on réussit à résoudre le problème grâce à 
la possibilité de définir explicitement dans le plan de phase z,x, la courbe z,;, — 
= @ (z,) sur laquelle la commande (dont le module d'après Q reste constant : 
| u | = 1) doit changer de signe. La courbe r, = ® (x,) s'appelle ligne de com- 
mutation de la commande. 

Puisque d'après (9) 


u (t) — sign Ÿa (4) = sign [—4n (to) (4 — to) + ba (401, (20.11) 


et la fonction 4 = —1% (to) (£ — to) + 2 (40) ne change son signe qu'une seule 
Po (Lo 


fois à l'instant t. — + t, la commande optimale z (t) change son signe 
1 (lo 
as plus d’une fois dans l'intervalle de temps t, < t < 1, avec t, l'instant où 
e point représentatif rejoint l’origine des coordonnées. 

Ainsi la commande optimale u = u (t) est une fonction continue par mor- 
ceaux (son module est | u (£) | = 1), qui compte au plus deux intervalles de 
permanence. 

Cette propriété de la commande optimale x (t) pente dans notre exemple 
de construire une famille de trajectoires optimales dans le plan de phase z,z.. 

Dans l'intervalle de temps où la commande u = 1, les équations (4) se met- 
tent sous la forme 


dz dz» 6‘ 
d'où l'on déduit 
dzi = La 
dte © 


En intégrant cette équation, on obtient la famille des paraboles 
= + C4 (20.13) 


dépendant du paramètre C,. Avec C1 = 0 on obtient la parabole 


nu= +, (20.14) 


qui pe par l'origine des coordonnées. L'’arc AO de la parabole (14) est repré- 
senté sur la figure 20.1. Les lignes X;B; (i = 1, 2, . . .) sont des arcs des para- 
boles (13) qui correspondent aux différentes valeurs du paramètre C1. 


D'une façon analogue, avec u = —1, les équations (4) deviennent 
dry dte 
& 7 PTE | (20.15) 
d’où l'on tire que 
dz, _ 
dre : 


En intégrant cette équation, on trouve la famille des paraboles 


= — 40 (20.16) 
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qui dépend du paramètre C.. Avec C: = 0 on obtient la parabole 
n=—S., (20.17) 


qui pare par l'origine des coordonnées. L'arc BO de la parabole (17) est repré- 
senté sur la figure 20.1. Les lignes L;A, sont des arcs des paraboles (16) qui cor- 
respondent à de différentes valeurs du paramètre C.. 

Désignons maintenant par T la ligne composée d’arcs 40 et OB. La ligne T 
divise le plan de phase x,z, en deux domaines D, et D, situés respectivement 
au-dessus et au-dessous de la ligne Tr. 

Si à l'instant initial t, le point représentatif se trouve dans le domaine D,, 
par exemple au point L;, il faut poser u = —1. Alors, le point représentatif 


By 
fr B; OÙ u=-] 


ITA à 0 Ch es 
Key 


u y 
Fig. 20.1 


suit l'arc L;4; de la parabole (16) qui passe par le point x (t6) = L;. A l'instant 
où le point représentatif rejoint le point 4,, 1l faut commuter la commande pour 
obtenir u = 1. Le point représentatif poursuit alors son mouvement suivant l'arc 
A;0, qui le mène à l'origine des coordonnées. La courbe L;,4,0, composée d'arcs 
Li4; et 4,0, est la trajectoire optimale qui correspond à l’état initial z (to) = Li. 
Suivant le théorème de l’unicité de la trajectoire optimale du problème de la 
réponse en temps minimal dans les systèmes linéaires {72], la durée du mouve- 
ment suivant la trajectoire Z;4;0 est minimale par rapport à la durée du mou- 
vement suivant une autre trajectoire quelconque qui mene du point L; à l'ori- 
gine des coordonnées. 

D'une façon analogue, si à l'instant initial le point représentatif se trouve 
dans le domaine D,, par exemple au point X;, il faut poser u = 1. Le point re- 

résentatif suit alors l'arc KB: de la parabole (13). Au point B,; il faut commuter 
a commande pour obtenir u = —1. Le mouvement ultérieur se poursuit suivant 
l’arc B;0 qui mène le point représentatif à l’origine des coordonnées. Ainsi, pour 
l'état initial x (t,) = Æ;, la trajectoire optimale est A,B,0. 

Comme nous l'avons dit plus haut, nous avons démontré pour le problème 
de la réponse en temps minimal dans les systèmes linéaires le théorème de l'’uni- 
cité de la trajectoire optimale [72] mise en évidence par le principe du maximum. 

Dans notre exemple, la démonstration de l'’unicité de la trajectoire optimale 
obtenue ci-dessus peut être immédiate [15]. Désignons par t, l’instant où le 
point représentatif atteint l'origine des coordonnées. La durée du mouvement 
suivant la trajectoire L;4,0 est alors t, — t,. Désignons par t. l’instant de com- 
mutation de la commande. _ » 

Supposons qu'il existe une autre commande u (t)}, où [u(t) | < 1, qui 
amène le système à l'origine des’coordonnées en un temps 1 — t,, où {? < ta. 
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Désignons toujours la trajectoire associée à la commande (9) par zx (t) et à la 
commande u (t) par z (t). On a ainsi les relations suivantes 


z(4)=0  z(n)=0, 
A(#)=0  Z:(#)=0. 
Les trajectoires z (£) et z (t) sont définies par les équations du mouvement 


n()=z()  ZaU=u(  (tb<t<h) 
et, respectivement, 


4 () = Ze (), Z, (4) = u (1) (fo << tT)- 
Introduisons maintenant les notations 
® (1) = A ()+ 2 (#) (E — te), 
P()=—-n (1) + ze(t) (t — te). 


z (to) = 21 (fo), za (to) = Za (to), 


® (to) = Ÿ (to). 
Les relations ci-dessus entraînent 
O (t) = 0, Y (t?) = 0. 
Les dérivées par rapport à ? de ©@ (t) et Y (t) sont 
De ee an Han ge ge = (te) u, 
dY 6 d71, 0Y d?e 


dt Gr dt ‘ or dt HT ot 


Puisque 


il vient 


Put—r)t. 


Comme sur la trajectoire L;,4,0 la commande z (t) vérifie les conditions 


u(t) = —1 pour 1€ [t, te), u (t) = 1 pour tE [t, til, 


alors, 
(—t)u()=l1t-tl (to <t< th). 
On voit aisément que toute autre commande u (t), où | ü (t) | < 1, donne 
lieu à l'inégalité 
(t—t)u(b<lt-tl  (t<t<t?). 


Des relations obtenues il suit 


D() > Ÿ (1), tElto, t*], 
d'où l'on déduit be 


tr t' 
| Od> À Ÿ dt 
to to 


Ainsi 
D (#)—© (to) > P (1) —Y (to), 
18—0393 
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et, puisque ® (t,) — Y (t), et, de plus, Y (1) = 0,ona 
® (tr) > 0. 


Par ailleurs, puisque nous avons supposé que ?, > t*, compte tenu du fait 
que © (11) = 0, on peut obtenir la relation 
t t! 
ou=0tr0tt= (af 11180, 
ti ti 
d’où il résulte que 
*  D(t#r)< O0. 
On aboutit ainsi à une contradiction. Par conséquent, il est impossible que 
t* soit inférieur à #. 


Supposons maintenant que t* = ty mais qu'il existe une commande  (t) 
différente de  (t) qui amène le système à l'instant t, à l’origine des coordonnées. 


Puisque u (4) + u (t), t Elte, t:1], ce qui vient d’être dit entraîne que 
ts ts 


| dt — | YŸ dt, 
to to 


soit 
D (41) — D (to) > Y (t1) — Ÿ (to). 


Comme © (to) = Y (to), ® (4) = 0, on a 


0 > —2 (t) + Ze (4) (hi — te), 
ce qui contredit l’hypothèse suivant laquelle 


Ë 4 0 
Ta (41) 
Par suite, il n’existe pas de commande différente de u (t) susceptible de recaler 
le système à l'origine à l'instant !.. 

Ainsi nous avons démontré l’unicité de la commande optimale (9) (sous la 
contrainte | u | < 1) et l'unicité de la trajectoire optimale associée à cette com- 


mande pour l’état initial donné. 
Cherchons maintenant la fonction de Bellman [pour le problème considéré 


@ (x (to)) = —T (x (to)). (20.18) 
Ici 
T(z(t)=t1— to (20.19) 


est la durée du mouvement du point représentatif suivant la trajectoire opti- 
male de la position initiale z (t) à l'origine des coordonnées x = 0 


Supposons qu’à l'instant initial t — t, le point représentatif se trouve au 
point L; du plan z,x., c'est-à-dire que x, (fo) et r+ (t9) sont les coordonnées du 
point Z;. En vertu de (16), l'équation de la parabole ont l’arc est la ligne L;4; 


a pour expression 


Zi — ps (eo) + C0), (20.20) 
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Le point À; de commutation de la commande est le point d’intersection des 
paraboles (20) et (14). L'ordonnée du point À; vérifie la relation 
: 3 (4 
Ga = (0) + EU. 


L'arc AO reposant au-dessous de l’axe des abscisses, il faut poser 


: RE 1/2 
ape = — [a (0) + +28 (0) |”. (20.21) 
Le mouvement du point représentatif suivant l'arc L;4; donne lieu aux 
équations (15). La deuxième de ces équations est de la forme 
dIza 


dt 


d’où, compte tenu du fait que les coordonnées du point L; sont désignées ici 
par Z1 (to) et ze (to), on a 


(x A pe te 
— | dt, (20.22) 
x2(to) to 


où t?. est l'instant de commutation de la commande. 
Il résulte de (22) que 


(&Ajdo — Ze (to) = to — te. (20.23) 
D'après (12), le mouvement du point représentatif suivant l'arc 4,0 donne 
lieu à l'équation 
da =i 
dt . 
d’où 
0 t 
| dze= \ dt, (20.24) 
(x 4) te 


avec !1, l'instant où le point représentatif rejoint l’origine des coordonnées. 
L'expression (24) entraîne 


—(zAj)e = {1 — te. (20.25) 
Il résulte de (23) et (25) que 
T (z (to)) = 4 — to = Ta (to) — 2 (ZA ;)2 (20.26) 


Conformément à (21), l'expression (26) se met sous la forme 
a 
T Ce (o)) = £ (to) + 2 [ai Go) + +23 Go | pour 3 (16) € Di. (20.27) 


L'expression (27) a lieu lorsque le point z ({,) se situe dans le domaine D;, 
c'est-à-dire en n’importe quel point du plan de phase au-dessus de la ligne AOB. 

Toutefois, on voit aisément que l'expression (27) reste valable, si le point 
z (t) repose sur la ligne AO. En effet, dans ce cas, te = fo, Ze (to) — (tAj)es 
et pour les points de la ligne 40 l'expression (26) devient 


T(z (to)) = —(za)2 = 1 (&A;)e | pour z (10) € AO, 
18* 
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ce qui coïncide avec l'expression (25) pour la durée du mouvement du point re- 
présentatif suivant l'arc 4,0. 

D'une façon analogue on peut trouver 7 (zx (t,)) pour le cas où le point z (t0) 
repose dans le domaine D, et sur la ligne BO. 

Dans le cas où le point z (t.) se situe dans le domaine D, c’est-à-dire en un 
point quelconque du plan de phase au-dessous de la ligne AOB, on a 


Te (ég)) = —23 (60) + 2 [21 Go) +28 Go) | pour z (14) € Da. (20.28) 


Si à l'instant initial le point représentatif se trouve au point B; de la ligne 
BO, le temps nécessaire pour recaler le système à l’origine des coordonnées est 


T (z(t))= (z8,): pour z (to) € BO. (20.29) 


Les formules (28) et (27) amènent que pour les points initiaux symétriques 
< et L; le temps d’amenée à l'origine des coordonnées est naturellement le 
même. 

On voit aisément qu'en points de la ligne AO, les fonctions (27) et (28) pren- 
nent les mêmes valeurs. En effet, puisque AO est un arc de la parabole (14) 

Ti 
He; 
aux points de la ligne AO la fonction (27) prend une valeur qui peut s’écrire, 
compte tenu du fait que la ligne AO repose au-dessous de l’axe des abscisses, 


LT (z (to) = — 1 ze (to) 1 + 2 1 za (to) 1 = 132 (to) | (x (40) € AO). (20.30) 
Aux points de la ligne 40 la fonction (28) prend la valeur 
[T (z (to))la = — za (to) = | za (to) | (x (to) € AO). (20.31) 


Les valeurs (30) et (31) coïncident. D’une façon analogue on peut montrer que 
les valeurs des fonctions (27) et (28) coïncident également aux points de la ligne 
BO; la valeur qu’ils prennent est égale à z, (to). 

Ainsi, la fonction 7 (x (t)) déterminée dans les domaines D, et D, respec- 
tivement par les expressions (27) et (28) conserve sa continuité dans tout le 
plan de phase z;,r.. 

Les dérivées partielles de la fonction (27) par rapport à ses variables sont 


a =lnto+s sat], 
a …. (20.32) 
= tee 0 [ato+ zit | (Go € Da. 


D'une façon analogue les dérivées partielles de la fonction (28) sont 
ôT 1 1-2 
| — Ti (to) + za (49) | , 


OT 


 . (20.33) 
= — 12e (6 [21004 5-2800) |? ( Go) € Da). 


Cherchons les valeurs que prennent les fonctions (32) et (33) au point 4;,, 
c'est-à-dire posons que 


T1 (lo) = (ZA; Za (to) = (ZA je. 
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Comme d’après (24) 
1. : 1/9 
(za a = [a (to) + = zi (o) | ; 


les valeurs des fonctions (32) en À; sont 


so a 
0z1 (to) AD: _ (4,)2 ’ 

9 
OZs (to) Aj€D: d — (&a,)2 ni 


Les valeurs des fonctions (33) en A4; où, comme sur toute la ligne AO, 
z, = , Sont 
en — 00 TT = — 00 
0Z; (to) A;€De : Ze (to) A ED: Cal ° (20.35) 


(34) et (35) montrent que les valeurs des fonctions (32) et (33) sur la ligne 
AO (arc de la courbe z, =) sont différentes. Sur la ligne BO (arc de la courbe 


Z1 = —<) les valeurs des fonctions (32) et (33) sont également différentes. 
Ainsi, aux points de la ligne AOB la fonction T (z (t)) et, par conséquent, 
la fonction w (x (t5)) = —T (z (t,)) ne possèdent pas de dérivées partielles par 


rapport à leurs variables z; (fo) et za (to). 


On voit sans peine que les trajectoires optimales construites dans 
notre exemple (fig. 20.1) vérifient les conditions de la synthèse ré- 
gulière énoncées dans ce qui précède (p. 269). 

Constatons de plus que dans l'exemple concerné, l’ensemble 
P9 = 0, c'est-à-dire l’ensemble P° ne contient que le point x = 0. 

L'ensemble P! = F, où par F on désigne la ligne composée de 
AO et OB (c'est-à-dire la ligne de commutation de la commande). 

L'ensemble P? = D, où D est le plan de phase x,z7. tout entier. 

L'ensemble N de notre exemple est vide. Ainsi, ici P*-1|JN — 
= P1, c'est-à-dire la réunion des ensembles P"-! et N est la ligne 
AOB (ligne de commutation de la commande l). 

Les lignes AO et OB constituent deux cases à une dimension de 
première espèce. Les domaines D, et D, qui s’obtiennent en divisant 
le plan de phase par la ligne [' forment deux cases de dimension deux 
de première espèce. -J 

Notons encore quelques propriétés des trajectoires optimales, 
suffisamment évidentes dans l'exemple considéré. 

Sur la figure 20.2 on désigne par zx (£,) le point où se trouvait le 
système à l'instant f,; la trajectoire optimale représentée mène du 
point z(f,) à l’origine des coordonnées. La position du point À; 
(où la commande est commutée) sur la courbe AO dépend de l’état 
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initial z (4) du système. Comme les points de la courbe AO vérifient 
la relation (14) 


(zA,)° 
(za), = 5 4 
en désignant 
Ex — (ra) (20.36) 


on peut mettre les coordonnées du point À; dans le plan 7,7, sous la 
forme 


Ainsi, la position du point À; (qui appartient à la ligne AO, 
c’est-à-dire à la case de dimension un de première espèce) n’est dé- 


u=/ £ Et) 


Fey 
Fig. 20.2 


terminée que par un seul paramètre Ë, qui est fonction de l’état ini- 
tial du système 


&1 = E1 (x (0). (20.37) 
D'après (21) et (36), 
E1 (Z (Lo) = — E (£o) + : T, (to) |” . (20.38) 
De même, l'intervalle de temps 
06, = te —to (20.39) 


pendant lequel le système passe du point x ({,) en À; est une fonction 
de l’état initial du système x (t,) 


6, = 0, (x (to)). (20.40) 
D'après (23), 
81 (x (to)) = —(z A): + Ze (Lo). 


En vertu de (21), cette expression devient 


6, (2 (#0) = 2e (to) + [aa (to) + +2) ] + (20.41) 
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Comme il ressort de (38) et (41), les fonctions E, (x (£,)) et 6, (x (to)) 
sont des fonctions continues et continüment dérivables de leurs 
variables x, (f,) et zx: (£,) (c’est-à-dire des coordonnées du vecteur 
z (to)). 

a le point initial x ({,) peut être choisi parmi les points 
quelconques de l’arc x de la trajectoire optimale dans le domaine 
D, les expressions (38) et (41) peuvent s'écrire 


(= (ut), (20.42) 


l/n 


81 (x) = 22 + (2: ++ 1) (20.43) 


Considérons maintenant le mouvement à rebours du point repré- 
sentatif qui se déplace du point À, vers le point x (4,). Ce mouvement 
s'obtient en inversant le temps t?. Suivant (15), le mouvement 
à rebours est décrit par les équations différentielles 


dy dys 
= — Yo: Fr : (20.44) 


Voici la solution des équations (44): 
pit) =ya(0)—y(0)—+, yolt)=ye(0)+t. (20.45) 


Comme dans le mouvement à rebours le point initial y (0) se situe 
sur la ligne AO, on a, d’après (14), 


y1 (0) = #0 : (20.46) 
C'est pourquoi la solution (45) peut être ramenée à la forme 
É 2 
nés t=S—u—S, y, E)=E+t (20.47) 
où par £ on désigne 
E — ya (0). (20.48) 
Etant donné que 
ee 
& | |E—t — nn ; 
Ôue due 1 y |F#0, (20.49) 
"dE ot 


l'équation (47) peut être résolue par rapport à E et à 1. 
Remarquons encore que si z (t,) est l’état initial dans le mouve- 
ment de départ (depuis le point zx ({) vers le point À;), en portant 
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dans (47) au lieu de E et / les variables 
EE (2 (to) = —[ 21e) + +2 (|, 
L= Bi (x (fo) = ze (40) + [ 24 (to) + 25 (60) |, 


on obtient 
Yi (O1 (x (to))s E1 (x (to))) = T1 (to); 
Ye (01 (T (to)); Ex (x (to))) = Ze (to); 


c'est-à-dire si le mouvement à rebours commence (comme il s'ensuit 
de (36)) au point À;, après un intervalle de temps 6,, le point repré- 
sentatif rejoint naturellement x (4,). 


$ 21. Condition suffisante d'optimalité sous la forme 
du principe du maximum 


Comme nous l’avons dit plus haut, le principe du maximum est 
une condition nécessaire d'optimalité. Par conséquent, le principe 
du maximum permet de mettre en évidence les trajectoires qui peu- 
vent être optimales. 

Pour les systèmes linéaires du problème de la réponse en temps mi- 
nimal on a démontré [72] le théorème d'existence d'une tra- 
jectoire optimale et le théorème d’unicité d’une trajectoire mise en 
évidence par le principe du maximum. Ainsi, dans ce cas, le principe 
du maximum définit d’une façon univoque la trajectoire qui peut 
être optimale; cette trajectoire est précisément la seule trajectoire 
optimale qui relie deux points donnés dans l'espace de phase. 

Pour les systèmes non linéaires (ainsi que pour les systèmes li- 
néaires des problèmes qui diffèrent du problème de la réponse en temps 
minimal), la question si la synthèse de la commande, synthèse réa- 
lisée sur la base du principe du maximum, aboutit aux trajectoires 
optimales se résout à l’aide du théorème démontré par V. Boltian- 
ski dans {14] sur les conditions suffisantes d'optimalité. En général 
ce théorème permet d'affirmer que la synthèse réalisée sur la base du 
principe du maximum aboutit réellement aux trajectoires optimales. 

Dans le théorème concerné, la condition principale est de réaliser 
la synthèse régulière de l'équation différentielle vectorielle (20.1) 
régissant le système de commande. Notons à ce propos que les con- 
ditions ÀA-£ (p. 269) de la synthèse régulière n’imposent en fait 
aucune contrainte au système décrit par cette dernière équation et 
postulent des circonstances usuelles qui se manifestent lors de la 
réalisation de la synthèse. Le théorème prouve que si Les conditions 
A-E sont remplies, la synthèse réalisée sur la base du principe du 
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maximum conduit réellement aux trajectoires optimales. En ce sens, 
le principe du maximum est une condition suffisante d'optimalité. 

Théorème sur les conditions suffisantes 
d'optimalité sous la forme du principe du 
maximum (14). Si dans un ensemble D on réalise la synthèse ré- 
gulière de l'équation (20.1) (sous l'hypothèse qu'il existe des dérivées 
2h Fr _ L et de la validité de la relation f, (x, u) >>0) toutes 
les trajectoires marquées sont optimales (dans le domaine D). En ce sens, 
le principe du maximum est une condition suffisante d'optimalité. 

Démonstration. La démonstration que nous allons ex- 
poser a été donnée dans l’article de V. Boltianski [14] publié en 1964. 
Nous nous bornerons ici au cas où dans l'expression (17.3) la fonction 


Îo (x, u) = Î 


ce qui a lieu dans le problème de la réponse en temps minimal. 

Dans ce cas la fonctionnelle Q est la durée du mouvement du point 
représentatif du point x (f,) au point a. 

Désignons par — (x) la durée du mouvement du point représen- 
tatif le long de la trajectoire marquée du point x au point a. 

Introduisons la notation M pour l’ensemble P"-1 |} N. 

Si l’on prouve que w (x) est la fonction de Bellman où M est 
un ensemble singulier, le théorème à démontrer se déduira 
du théorème démontré au $ 15, p. 232. 

Donc, il suffit de prouver que la fonction w (x), introduite ici, 
est dérivable sur l’ensemble D X M et vérifie l'équation de Bellman 
(15.7) 


continues 


mx (D LE fi(z, u)|=1. 


ut Q 


Soit z un point arbitraire qui appartient à une certaine case 6 
de dimension » et supposons que la trajectoire du système (20.3) 


D =f(x v(x), 


issue à l'instant ?, du point x indiqué, passe à l'instant {, + 6, (x) 
par le point E, (x) de la case IT (0). 

Il suit des théorèmes généraux sur la dérivabilité des solutions 
des équations différentielles par rapport aux paramètres que les 
fonctions E, (x) et 6, (x) sont des fonctions continûment dérivables 
de zx. 

Pour l'exemple de système linéaire étudié au $ 20, la forme expli- 
cite des fonctions E, (x) et 6, (x) est déterminée par les expressions 
(20. 42) et (20.43). Dans le cas général, ces fonctions se calculent 
d’après la solution de l’équation différentielle qui décrit le mouve- 
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ment à rebours 


y = —f (y, v (y). (21.1) 
La solution de l'équation (1) est 
y = y(t, Ë), (21.2) 
où E — E, (x), t = 6, (x). L'équation 
y, É)=7zx (21.3) 


est résoluble d’une façon univoque pour des x voisins de zx (f,) car le 
déterminant fonctionnel correspondant est différent de zéro. (Dans 
l'exemple considéré au $ 20, les équations du mouvement à rebours 
sont de la forme (20.44) et le déterminant fonctionnel mentionné, 
de la forme (20.49).) Les fonctions E, (x) et 6, (x) trouvées à partir de 
(3) sont continüment dérivables par rapport à zx. 

Après le point E, (x) la trajectoire passe par la case II (o) ou 
Z (I (o)). D'une façon analogue on établit que le point £. (x) où 
la trajectoire quitte la case II (o) ou Z (II (o)), et le temps 06. (x) 
du mouvement dans cette case sont des fonctions dérivables par rap- 
port à &, (x), et donc par rapport à x. 

Le temps total —o (x) = 6, (x) + 6, (x) + . .. du mouvement 
suivant la trajectoire marquée du point x au point a est ainsi (à 
l’intérieur de la case o) une fonction continüment dérivable du point x. 

Ce qui vient d’être dit entraîne que la fonction w (x) est continü- 
ment dérivable sur l’ensemble D M. 

Maintenant il faut montrer que la fonction © (x) vérifie sur l’en- 
semble D X M l'équation de Bellman (15.7). 

Soit zx (to) E D M. Désignons par zx (t) la trajectoire marquée 
issue à l'instant {, du point zx (f,) et qui à l'instant £, rejoint le 
point a. 

Désignons par S l'ensemble de tous les points x qui satisfont à 
la condition 


& (2) = & (x (to). 


Au voisinage du point zx ({,) l’ensemble S forme une hypersurface 
lisse dans D avec le vecteur 


— (2 (z (to) 90 (z (to) 
grad & (zx (£o)) — ( ds Den ] 
qui lui est normal. 

La fonction &w (x (fo)) — —(t1 — to), où t, — to est la durée du 
mouvement suivant la trajectoire marquée du point x ({,) au point a. 
Pour tout point courant z (t) de la trajectoire marquée, la fonction 
. do(z(t)) 

dt 


@(x(t)) = —(t. —t), ce qui conduit à — 1. Puisqu'en 
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vertu de (20.3) 


Ée PRE “b=sto — À  — fi Go), v (& (Go): 
il vient 
2 EC fi (x (lo), V ( (E0))) = 1 (21.4) 
ou 
(grad w (x (to)), f (x (to), v (x (to)))} = 1. (21.5) 
Il résulte de (5) que 
grad @ (x (t0)) 0. (21.6) 


D'après la condition Æ de la synthèse régulière, la trajectoire 
marquée vérifie le principe du maximum. Désignons par 


Ÿ (£) Sn: (Ÿ (e), ee.) Ÿn (c)) 
le vecteur fonction qui correspond à la trajectoire x (f) en raison du 
principe du maximum. 
On peut montrer que le vecteur 1 (£,) est orthogonal à l'hypersurfa- 
ce S au point x (to), soit 


Ÿ (4) = À grad © (x (to) (21.7) 
ou, ce qui revient au même, 
Ÿ: (ko) = 1 ET (=... n) (21.8) 


Conformément à (17.21) et (20.3), la fonction À est ici de la forme 


H (Ÿ, x, v(x)= À Via (x, v(x)). (21.9) 
D'après (9), (8) et (4) 


H (b(éo), (to); v (x (to))) = D Di (bo) fa (x (to); V(z (to))) = 


1=1 


= AD ED j (2(40), v(z()))= A. (21.10) 
1=1 


Puisque (17.27) conduit à 


ÆH (tb (4), x (6), v (x (1))) 2 0, 
on obtient de (10) et du point 2° du théorème 2 (p. 245) que À > 0. 
(7) entraîne que À 0, puisque autrement on aurait w (4,) = 0. 
Ainsi 
À> 0. (21.11) 
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On déduit du principe du maximum que pour fout u€ Q 
H (4 (to); € (to); L (x (to))) Z H (b (to); Z (to), u). (21.12) 
On trouve de (12), (4), (8), (10) et (11) que pour tout u € Q 


1 — DE _ 20e) fi(z (to), v(x(b))) = + > Pi (bo) fi (x (do), v (x (to))) = 


“+4 (to), Z (to), v(z(H)})>+H (te), z(to), u)= 


154 Ga) fu(z(o), = 3 22 EU) UD j, (z (koh, u). (21.13) 
ii 1— + 


(13) entraîne la to 


max S Et) ;, (z(to), u)=1, (21.14) 
ueQo 
qui coïncide avec l'équation de Bellman (15.7) du fait qu'on peut 
adopter comme point initial x (f,) tout point x (appartenant à l’en- 
semble D X M) de la trajectoire marquée. 
Ainsi, si La condition (7) est respectée, la fonction « (x) satisfait 
sur l’ensemble D X M à l'équation de Bellman (15.7). 
Pour achever la démonstration, il faut encore montrer que la 
relation (7) est vraie 
Ÿ (4) = À grad w (x (to). 
La trajectoire marquée zx (t) est issue à l'instant f{, du. point 
z (to) qui se trouve à l’intérieur de la case de première espèce 0:. 


Désignons par zx ({) la trajectoire du système (20.3) 


T=i(s v(a)), 


issue d’un point intérieur zx (f,) de cette même case 0,. Considérons 
que le point zx (4) se trouve suffisamment près du point x (#) et, 
de plus, repose sur l’hypersurface S. Cette circonstance entraine 
que les deux trajectoires x (1) et x (t) issues à l'instant f, des points 
respectifs z (£,) et x (#4) atteignent le point a au même instant f, = 
= —@ (z (to)) + Lo = —0 (z (to)) + to. 

Introduisons la notation & pour la distance entre les points 
x (to) et z (£o) et considérons que # est suffisamment petite. 

Comme les points x (4,) et x (t,) se trouvent dans la même case 02, 
les trajectoires zx (t) et x (t) rejoignent le point a en passant par la 
même suite des cases 6, Co, . . C4, où 0, est la case à une dimension 
adhérente au point a. 

Nous avons montré plus haut que les instants T; (i = 1, 2, .. 
+, 9 — 1) de passage de la trajectoire marquée x (t) d'une case 
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dans l’autre et les points correspondants de la trajectoire zx (t;) 
sont des fonctions dérivables du point initial x (£,) € ©. 
Désignons par 6: l'intervalle de temps 


== (e4,2,.,., 90); 


en posant To = lg, Ta = t- 
Le fait que u et z (a) sont des fonctions dérivables du point 
z (to) € o1 (et t, et z (ti) sont des fonctions dérivables du point 


Z (to) € 01) entraîne qu'il existe une constante C positive telle qu’au- 
cun des intervalles de temps Ô, (i = 1, 2,..., q — 1) ne dépasse en 


module Ce, et les trajectoires x (t) et x (t) se trouvent l’une de l’autre 
à une distance de même ordre que €: 


IT —z(HDISCe (bo <t<h). (21.15) 


Effectuons maintenant quelques transformations. De même que 
précédemment, désignons par 4 (t) = (4, (4), . . ., w, (t)) le vecteur 
fonction qui en raison du principe du maximum correspond à la 
trajectoire zx (t). 


Puisque z(4)=z()=a on a 
n 


— [ri (Lo) — Zi (£o)] Vi (do) = 


1=1 


= — D [x (to) — Zi (to)] De (do) + D Le (és) — Zi (ta)] Vi (1) = 


i=! 1=1 


- |: pr {: 5 Ere (#)— 21 (0) be (} dt = 


izz 1 


= À D be) Lei (D — (+ > Lei (0) — 21 (01 LEO) = 


e im! 

= { D V: (4) [fa (z (£), U(x (£))) — fs (x (£), D (x (£)))] — 
to 1=1 

AM AR Las 


= | {AGE 20, (ON) HE, 20, v&E)— 
to 


_ D ri () — 1 (01 OH (Wb (+), 0 v (z(t))) À dt. 


1=i 
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ñn {1 
— D) Li (60) — 2: (60)] bi (to) = | F (dt, (21.16) 


1=! lo 


F(t)=H (D), ze), v(x (0) —H (D), z (8), v (x (0) — 


— Sri) — 2 (0) GO: F0 2E0N . (21.17) 
i=1 
Si l’on désigne par ë un certain point du segment qui relie les 
points x (t) et z (t), en vertu du théorème connu de Lagrange on 
a la relation 


H(b(t), z(), v(z())—H(b(), xt), v(z(0))= 
= DA (02 (0) UE LEO) (24.18) 


i=! 
C'est pourquoi l’expression (17) peut s’écrire 
F()=—H{(p{),z(, vx) + A (0, z(t), v(x (1) — 


— D [x (0) — 2x1 (0) [ALU EU ED _ 0H ( se v (z 7 | 
ES 


(21.19) 


Comme zx (t) et v (x (t)) représentent la trajectoire marquée et la 
commande associée, qui d’après la condition Æ de synthèse régulière 
vérifient le principe du maximum, on a en vertu de la relation 
(17.28) 


H(b(),z(),v(z (1) > H (p(t), z(t), v (x (D)). (21.20) 
Il suit des relations (19) et (20) que 


F (t) > G (+), (21.21) 
où 
G(= — Ste 2 [AOL OLEO) _ 


if 
EE OI (b(e), &, v(z 0] | (21 22) 

OT; SE 

Examinons maintenant les deux cas suivants. Dans le premier 
cas, le point t appartient à l’un des intervalles de temps A; pendant 
lequel z ({) et x () se trouvent dans la même case 0; dans laquelle la 
fonction v (x) est continüment dérivable. Compte tenu de (15), on a 
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l'estimation 
lou(()—v(a(DISC Ir —r(1< CC'e. (21.23) 


Puisque le point E repose sur le segment qui relie les points x (t) et 
z (t), on a d’après (15), 


LE rDlS<lIrd—z(|1< Ce. (21.24) 

La fonction _ étant continue par rapport à ses variables, pour 
tEA;la différence 

OH ( (), x (8), v (x (0))) OU (p(#). Es v (x (0))) (21.25) 


Ur; OT} 


est un infiniment petit de même ordre que & et tend avec & vers zéro. 
Donc, d’après (15) et (22),on a 


G 0 


lim—= —0 (uniformément par rapport à 4€ Ai). 
e—0 
On en tire 
lim | Gé)dt=0 (i=1,2, ..., q), (21.26) 
e-0 © 


thg 


où {,, est l'origine de l'intervalle A;. 

Dans le deuxième cas, le point £{ appartient à l’un des intervalles 
de temps 6, pendant lequel x (é) et x (t) se trouvent dans deux cases 
voisines 0; et 0;3+,. Ici on ne peut déjà plus affirmer que la différence 


(25) est infiniment petite avec e, du fait que les points x (f) et x (t}) 
appartiennent à des cases différentes et lorsqu'on passe d’une case à 
l’autre la commande v (x) peut subir des discontinuités. 

Toutefois, pour tout f, la différence (25) est encore bornée du fait 
que la trajectoire zx (t) est bornée. C’est pourquoi, conformément à (15), 


lim G(t) = O0 (uniformément par rapport à # € Ô;). 
e—+0 


La longueur du segment 6; ne dépassant pas Ce (cf. p. 284), il vient 


trititô; 
lim + | G(thdt=0  (i=1,2,...,g—1). (21.27) 
Us t,;+4; 


En additionnant les relations (26) et (27), on obtient 
ti 
lim + = | G(t) dt = (21.28) 


£—0 A 
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Supposons maintenant que le point z (4) s'approche du point 
z (to) suivant la surface S dans la direction d’un certain vecteur 
P = (Pi, Pas + + + Pn). On a alors 


lim ZUo)—z(t) _,, (21.29) 


e—0 E 


PT (16), (21) et (28), on a 


5 PaŸi (to) = lim s 1 [re (0) — 21 (to)} Pi (to) = 


i=1 i=1 
LT {: 
= lim | F(t)dt>lim À (a«) dt=0. (21.30) 
e-0 € FA e0 € 4 


Lorsque Z (£9) —> x (to) la trajectoire z (4) — x (+) et la différence 
FD —G(t)=H(p(), ze), v(z (0) — H(b(t), z (0), v (& (b)) 
(21.31) 


conditionnée par l'inégalité (20) peut être représentée par une expres- 
sion analogue à (18). En reprenant les raisonnements employés pour 
déduire la relation (28), on trouve que 


ti 
e | 0 
0 | LF()—G(H1dt=0, (21.32) 


d’où, en vertu de (30), on obtient que pour tout vecteur p tangent 
à l'hypersurface S au point x ({,) on a la relation 


2 Pitié) = 0. (21.33) 


L'expression (33) entraîne la relation (7) ; le théorème est ainsi 
démontré. 


$ 22. Liaison du principe du maximum avec 
la programmation dynamique 


Considérons le problème à extrémité fixée de la trajectoire et à 
temps libre. Examinons le système décrit par les équations diffé- 
rentielles 

d | 
= fj(as es En Un sw)  (j=t,...,n), (22.1) 
à l'équation vectorielle 


& — Î (x, u), (22.2) 
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où zx, u et f sont les vecteurs 


TZ! Us f(x, u) 
z=|...|,u=|...|, f{au)=|...... ù (22.3) 
Tn Ur J. fn (Z» u) 


On demande de ramener le système du point z (f,) de l’espace de 
phase X au point donné x*. L'’instant t, où le point représentatif 
tombe en z* n’est pas fixé à l'avance. 

La commande u = u (t) doit satisfaire aux contraintes 


u E Q, (22.4) 
et il faut la choisir de façon que la fonctionnelle 
{1 


Q= | f(x (8), w (EN dE (22.5) 
to 
soit minimisée. 

Admettons que la commande qui satisfait à ces contraintes, la 
trajectoire qui lui correspond et l'intervalle de temps #, — t, sont 
optimaux. 

La valeur minimisée ® (x (f,)) de la fonctionnelle Q, obtenue dans 
ces conditions, est fonction de l’état initial z (4,) du système 


D (x (to)) = D (21 (lo)r Ta (Lo), + - +» Zn (Lo). (22.6) 


Nous avons montré au $ 14 que sous l'hypothèse que la fonction 
® (zx) est continue et possède partout des dérivées partielles continues 
par rapport à toutes ses variables, cette fonction vérifie l'équation 


non linéaire du premier ordre aux dérivées partielles (équation de 
Bellman) (14.36) : 


: É 00 (zx 
min (etes + 3 Gite 0] 0 


Introduisons, comme dans ce qui précède, la notation x, (t) pour 
la fonction scalaire déterminée par l'équation différentielle 


PO fo(rus er ns Us es Ur) = fo(zs u) (22.7) 
et par la condition initiale 
4 (15) — 0! (22.8) 


On déduit de (7), (8) et (5) que la fonctionnelle Q à minimiser peut 
s'écrire 


Q = %o (hi). (22.9) 


19—0393 
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Introduisons les vecteurs de dimension (nr + 1): 


: Lo Îo 
— El , Î— Ë Îs |. (22.10) 
LTn | fn 


Désignons par ® (x) la fonction 
D (zx) = zo + D (Zi, Ze ee En) = To + Dix). (22.11) 
L'équation de Bellman (14.36) pourra maintenant s’écrire 


min D) 2e fi (x, u)—0. (22.12) 


Si l’on multiplie les ess membres de (12) par —1, le signe min 
du premier membre de (12) doit être remplacé par max. Ainsi, l’équa- 
tion (12) peut se mettre sous la forme 


È L _ G : 
max 2 [ EL] fi(x, u) = (22.13) 
D'une façon analogue à (15.28), introduisons les notations 
œ (x) = —0 (2), (22.14) 
© (x) = —O (x). (22.15) 


L'équation de Bellman de devient alors 


max D À Fe f(x, u) =0. (22.16) 


Dans ces conditions la Ver supérieure est atteinte pour une certaine 
u E Q, ou, plus précisément, pour la valeur que prend la commande 
optimale à l'instant de la sortie du point x. 

Enonçons encore les hypothèses supplémentaires suivantes. Sup- 
posons que la fonction « (x) possède des dérivées secondes canti- 


nues (i,j—1, .…,n), et les fonctions f;(x, u) possèdent des 


Aérivées oatinues 


Le U=0;1;.: mi=1l;:;:n) 


La fonction sous le signe max du premier membre de (16) se note 


n 
ut () 
g(x,u)= ” Lei fi (x, u). (22.17) 
i=0 
Soit u (t) (bb Lt t1) la commande optimale qui ramène le point 
représentatif de l’état z (t) à l’état z*, et x (t), la trajectoire optima- 
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le associée. Fixons un certain instant £ (4, < t < t,) et considérons 
la fonction g (x, u(t)) de la variable z. Conformément aux hypo- 


thèses précédentes, la fonction g (x, u (t)) possède des dérivées conti- 
nues par rapport aux variables x; (i = 0, 4, ...,n): 


dg É u (t)) LE 920 (x) fi(z, u(t)) + > SE du _ of (x, u (6) (22.18) 


"Oz; 0zR CET 
(&=0,1,:;::,n): 


L'équation (16) entraîne que tout mouvement optimal (x (t), u (t)) 
donne lieu à la relation 


g((t),u(t)= 0. (22.19) 


Les points x qui.à l'instant fixé ne reposent pas sur la trajectoire 
optimale, appartiennent à d'autres trajectoires réalisées par des 
commandes admissibles mais non optimales. C’est pourquoi en 


raison de l'équation (16), en ces points 


ga u)< (22.20) 


Par conséquent, la fonction £ G, u (t)), éxaminée au (18), de la 
variable x atteint au point zx = x (t) le maximum (l'instant f est 
fixé); donc, en ce point, ses dérivées partielles par rapport à 2, 
Zi + +. % S'annulent. D'après (18), on obtient ainsi les relations 
suivantes observées le long de la trajectoire optimale 


> PSE) j (29, u o+> EC EG Lo (22.2 


| Or 07p OTR = OZ; 
Œ=0, ds ...…)7, Lo LiLti). 


En tenant compte que d’après (1) et (7) le mouvement optimal 
(x (t), u (t)) donne lieu à la relation 


MO fr, u()  (G=0,1,...,n), (22.22) 


On &a 


d  dw(z (t)) d2w (z (t)) dz; _dzi(t) 
a Cr EPA ET) = > TÔz107 dt 


=> PSE) ; (249, u(O). (22.23) 


CEATETS 
ES | 


19% 
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En vertu de (23), la relation (21) s'écrit 


d f dw(z(t)) d6 (z (t)) dfi(z (£), u (4) 
T( w (z )+5 JG) %GGuG) _; (22.24) 


ÔZh OT; OTR 
i=0 


(k=0, 1, ..., n). 
Désignons par ‘, (t) (4 = 0, 1, ..., nr) la fonction 


Dn (t) = EE (t)) 
Il résulte de (24) que : long de toute trajectoire optimale les 


grandeurs wŸ, (t) satisfont au système suivant d'équations différentiel- 
les linéaires 


(k=—0,1,..., nr). (22.25) 


dhn(t) _ Of; (x (t), u (t)) _ 
SO. 5 MEME, i (2) (k=0,1,...,n). (22.26) 
Remarquons que d’après (25), (15) et (11), 
Yo (4) = —1, (22.27) 
ce qui ne contredit pas les équations (26) du fait que d’après (1) et (5), 
fi (æ (t),u(t})(i = 0,1,...,n)ne dépendent pas de x, et pour 4 = 0 
l'équation (26) se met sous la forme 
HO 0, (22.28) 


Le vecteur + dont les coordonnées 1} (4 = 0, 1, ..., n) sont dé- 
terminées par les relations (25) a pour expression 


— Li 


0w 
ER — 
Vo 00 dv 
p=|V =] 3 |=| 3; (22.29) 
Ya pa . 
w 0w 
an Lo 


Conformément à (25), (10) et (29), l'équation de Belilman (16) 
devient 


à a (£) fa (æ (e), u (#))= max 22 wi (6) fi (z(t), u)= 
= max (p (4), f(z(t), u))=0. (22.30) 
Désignons par À (ÿ, x, u) la fonction 


H (hs u)= à dafi (xs u) = (be f(x u)), (22.31) 


$ 23] EXEMPLES D'APPLICATION DU PRINCIPE DU MAXIMUM 293 


qui dépend de 2n + r + 4 variables 44, y, . . +, Vns Lis + + +, Zn, 


RS 
L'équation (30) se met sous la forme 


max À (bp, r,u)=0. (22.32) 
ucQ 


La relation (32) permet de conclure qu’à tout instant £ la com- 


mande optimale u ({) maximise la fonction À par rapport à toute 
autre commande u € Q@ qui ramène le système du point x ({,) au 
point z*. Cette valeur maximale est la même, plus précisément elle 
est nulle en tout point de la trajectoire optimale, c'est-à-dire l'égalité 


H(b(d, z(t, u(t)=0 (22.33) 


est vérifiée le long de la trajectoire optimale. 

Notons, toutefois, que les relations (30), (32) et (33) sont obtenues 
ici sous l'hypothèse initiale que la fonction O (x,, ..., x,) admet 
des dérivées partielles continues par rapport à toutes ses variables, 
ce qui, comme nous l’avons montré plus haut ($ 20), n'est pas le fait 
même de problèmes relativement simples. C’est pourquoi les trans- 
formations données dans le présent paragraphe et les corrolaires qui 
en découlent n'ont qu'un caractère euristique et ne peuvent servir 
que d'indications suggestives. 


$ 23. Exemples d’application du principe du maximum 


1. Théorème sur le nombre de commutations d’une commande 
dans le problème linéaire de la réponse en temps minimal. Consi- 
dérons un système régi par l'équation différentielle vectorielle 
linéaire 


dx 
— = Az+ Bu, (23.1) 
où x, À, B sont les matrices 
Ti "As Ag... Ain 7 Bi — 
Z = . + , À = ee + , B = . , 
In Ant Anse... Ann_ Ba 
(23.2) 


et où la commande uw est une fonction scalaire soumise aux contraintes 
—1<Lu<Li. (23.3) 


On demande de faire passer le système du point x (0), où le sys- 
tème se trouve à l'instant f{,, au point z—0 en un temps minimal. 
Désignons par + le vecteur de dimension n 


Le 
= ne, 
= Vn 2 


, (23.4) 
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et introduisons ET (17.21) la fonction 


H(ÿ, z,u)= ù à Viéinth + 2 > Bypju = (, Ar) + (b, Bu). (23.5) 


D'après Fe a les no. dy G = 1, ..., n) vérifient les 
équations différentielles 


... Anjr (j=1,...,n). (23.6) 


k=1 
Le système d'équations différentielles scalaires (6) est équivalent 
à l'équation différentielle vectorielle 
d 
= — A, (23.7) 
où, d’après (6) 


A*=| Ass 4e... Ans |, (23.8) 


La matrice A* est la transposée de la matrice À. 
L’équation différentielle vectorielle (7) est conjuguée à l’équation 


Comme nous l'avons montré plus haut (18.51), les intégrales des 
équations (9) et (7) jouissent de la propriété suivante: 
(6 (9), p (0) ) = (E (0), y (0)). 


D'après (18.53), la matrice fondamentale X (4) des solutions de l’équa- 
tion (9) et la matrice fondamentale € (£) des solutions de l'équation 
(7) vérifient la relation 


E* (4) = X-1 (0). 


X (9 = X (—+), 


D'après (10.160) 


et donc 

E* (4) = X (—b), (23.10) 
d'où il résulte que les racines des équations caractéristiques 
det (ÀE — 4) = 0 et det (UE + A*) —0 associées aux équations diffé- 


rentielles (9) et (7) ne different que par les signes ([28], p. 171). 
En vertu du théorème 2 ($ 17), la commande optimale est 


u (£) = sign > Bb; (6). (23.11) 
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Considérons le cas où toutes les racines À; (à = 1, ..., n) de l'é- 
quation caractéristique 


det (LE — A) = 0 


sont simples et représentent des grandeurs réelles. 

Dans ce cas, la propriété du système conjugué indiquée ci-dessus 
fait que la solution de l'équation différentielle vectorielle (7) est la 
suivante! 

ñn a | 
= TS Cet (j—=1,..., n), (23.12) 


où y (1 = 1,...,n) sont des variables réelles, et C;,(j,1 = 1,...,n) 
certaines constantes qui dépendent de » constantes arbitraires qu’on 
détermine en donnant les valeurs initiales 4, (0) G = 1, ..., n) 
des fonctions #; (t) (ou les valeurs que doivent prendre les fonctions 
y (£) à tout autre instant fixé). 


En portant dans (11) les expressions (12), on obtient 
u (t) = sign (Szeit + Seat EL ,.. LH Shehnt), (23.13) 


où S; sont des constantes 


S;= > By  (j=1,...,n). (23.14) 
v=! 
Puisque le nombre de zéros de la fonction 
s(t)}= >» Sje"i (23.15) 
j=1 


dans l'intervalle 0 << £ << œ ne dépasse pas nr — 1, la fonction uw ((t) 
définie par l'expression (11) et dont le module |u (t) | = 1 est une 
fonction constante par morceaux possède dans l'intervalle de temps 
0O<t<t, au plus rz — 1 points de discontinuité, c’est-à-dire la 
fonction u ({) possède au plus 7 intervalles de permanence. 

Autrement dit, le nombre de commutations de la commande 
u (t) ne dépasse pas n — 1. 

Le théorème démontré s'appelle théorème de nr intervalles; 
il est dû à A. Feldbaum [85]. 

2. Problème de l'écart maximal. Considérons le système décrit 
par l'équation différentielle scalaire 


PTE (x, u), (23.16) 


fa (tis u) = — ax; + bu. (23.17) 
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La commande x subit la contrainte 
—1<Lu<i. " (23.18) 


On demande de choisir la commande w telle que l’écart du système 
x; (T) à l'instant T soit le plus grand possible. 

Bien entendu pour un système décrit par une équation aussi simple 
que (16), la solution du problème peut être immédiate. 

Toutefois, cherchons sa solution à l’aide du principe du maxi- 
mum pour illustrer la méthode générale par un exemple exempt de 
calculs trop longs. 

Désignons par Q la fonctionnelle 


T 
Q= | fo(z u) dt, (23.19) 
0 
avec 
fo (is U) = —f1 (ts U) = ax; — bu. (23.20) 
Introduisons la notation zx, (t) pour la fonction scalaire qui véri- 
fie l'équation différentielle 
dz 


= Îo (is u) (23.21) 
et la condition initiale 
zo (0) = 0. (23.22) 
Onjtire de (19), (21) et (22) que 
Q = zo (T). (23.23) 
D'après (16), (21) et (20), 
dz dz 
= (23.24) 


d’où, en tenant compte de (22), on a 
Zo (T) = —x (T) + mi (0). (23.25) 


L'écart initial x, (0) ne dépendant pas de la commande, la rela- 
tion (25) entraîne que la commande u(t), minimisant la fonctionnelle 
Q, maximise la valeur possible de l'écart z, (T). 

Désignons par + le vecteur 


Yo 
Ÿ = hs | (23.26) 
et introduisons d'après (17.10) la fonction 
À (+, z, U) = Ÿofo (tas U) + Via (Ans U) = 

= & (bo — Y1) A + b(—VŸo +h)u. (23.27) 
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D’après (17.14), les fonctions #, et Ÿ, vérifient les équations 


do _ 0H do 
A a ut (23.28) 


qui, conformément à (27), se mettent sous la forme 


Do 20, UE = ai — a. (23.29) 
La solution générale des équations (29) est 

Vo = Ci Ya (6) = Cre + Ci. (23.30) 

Le problème concerné est un problème à temps fixé T et à extré- 


mité libre de la trajectoire. C’est pourquoi, d’après (17.55), les fonc- 
tions w, (é) et w, (4) doivent vérifier les conditions 


Vo (7) = —1, 1, (7) = 0. (23.31) 
Sous les conditions (31) les solutions (30) deviennent 
Vo(t)=—1, pi(fj=et-T 1. (23.32) 
Si la commande s'écrit 
u (4) = sign [—1h (+) + 1 (1, (23.33) 


pour b >> 0 la fonction Æ (1 (t), z (t), u) définie par l’expression (27) 
de la variable u (soumise aux contraintes (18)) atteint le maximum 
au point u = u (t) pour tout 1 (0<1< T). 

En remplaçant dans (33) , (t) et 1, (£) par leurs expressions 
(32), on obtient 


u(t)=signet(t-T)—1, (23.34) 
Sous la condition (34) on trouve à partir de (16) et (17) 
max m(T)=21(0)e-eT + 2 (1—e-0T), (23.35) 
i<u<i 


ce qui, comme nous l'avons déjà dit, est évident dans ce problème. 

3. Application du principe du maximum à une commande non 
soumise aux contraintes. En l’absence des contraintes, dans de nom- 
breux cas il est possible d'obtenir sous une forme explicite la 
solution du problème du choix de la commande minimisant une 
fonctionnelle. 

Etudions le système décrit par l'équation différentielle scalaire 
(cf. $ 16, point 2) 


A = fi (g, u), (23.36) 


fs (qu u)=<u, (23.37) 
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et dont l’état initial est 
[qu () Jim 0 7 Qi (0). 


(CH. 5 


On demande d’amener le système à l'instant £, au point q, (£,) = 0 
en choisissant la commande u = u (t) minimisant la fonctionnelle 


t1 
Q= | fo(qi: u) dt, 
0 


avec 


fo(g, u)=—- S Qi ui. 
Conformément à (17.10) construisons la fonction 
H (1, que u)= Vofo (qu, u) + af: (gs, u)= | 
= Yo ( —5 9 +-u?) + pu 
et composons les équations 


dgy _ 0H dy; _ oôf 
dt by dt  ÿdg; U=0, 1). 


Cherchons maintenant la commande w (ne supportant aucune 


(23.38) 


(23.39) 


(23.40) 


(23.41) 


(23.42) 
(23.43) 


contrainte fixée à l'avance) maximisant la fonction À. Etant donné 


que 


2 LA pou), 224 Ÿo 


sous la condition 
Ÿo < 0, 


la fonction À possède un maximum par rapport à 4 avec 


u= —Ÿ 


Yo 
La première équation (43) entraîne 


Yo = Const. 


(23.44) 


(23.45) 


(23.46) 


(23.47) 


Y 
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En portant dans la deuxième équation (42) la valeur optimale de la 
commande uw définie par l'expression (46), on a 


es (23.48) 


En dérivant par rapport à £{ les deux membres de l'équation (48) 
et en tenant compte que Ÿ, = const, on obtient 


A nn UE (23.49) 
En vertu de la deuxième équation (43), l'équation (49) s'écrit 
dè 
Ti = — kgs, (23.50) 
où 
9 C 
=. (23.51) 


Nous avons ainsi abouti à un problème aux limites qui consiste 
à résoudre l'équation différentielle (50) vérifiant les conditions 


[gs (t)lt=o — ga (0), (qi (é) lits = 0. (23.52) 
Voici la solution que nous recherchons 


qi (= — 4000 in kg qu (0) cos ke. (23.53) 


sin kt: 
La solution (53) existe sous la condition 
he  (n=1,2,3,...), (23.54) 


que nous allons supposer remplie. 
Il résulte de lazdeuxième équation (42) que 


u = m ‘ 
d’où, en vertu de (53), on obtient 
u= —Ÿ mc gi (0) Se Fe cos kt + sin k|. (23.55) 


En comparant l'expression (46), obtenue d’après le principe du 
maximum de Pontriaguine, avec la deuxième équation de (42), on 
en tire que dans ce problème 


Vip (23.56) 
d'où 


wi (t)= V mc qi (0) ËÉ me cos kt + sin ke | ÿ (257) 
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Constatons que pour le système mécanique dont la fonction de 
Lagrange est 


4 °« | a 
L = Mi — > Cqi, (23.58) 
l'impulsion canonique p, est 
DE = po (23.59) 
qi 


Il en résulte que pour un système commandé décrit par l’équa- 
tion (36) 
U — Di (23.60) 


Yi = —VoPa (23.61) 


où p, est l’impulsion canonique d’un système mécanique (58). 

Les relations (60) et (61) ont lieu parce que dans ce cas, de même 
qu’au $ 16, point 2, la fonctionnelle (38) est choisie telle que pour le 
système mécanique (58) elle devient 


Q= ( Ldt, (23.62) 
0 


ce qui représente l’action hamiltonienne, qui d’après le principe 
de Hamilton, prend une valeur stationnaire pour des mouvements 
réels d’un système mécanique. 

En substituant dans (40) à uw et w#, les expressions (60) et (61), 


Canet 


on obtient pour la fonction H 
H=—Y (F+<E) (23.63) 


c'est-à-dire la fonction }7 de notre exemple est le produit de la fonc- 
tion de Hamilton du système mécanique (58) par la constante — 1. 


$ 24. Systèmes linéaires optimaux à critère quadratique 
de performance 


1. Problème du régulateur d'état [34, 52]. Considérons le systè- 
me linéaire non stationnaire 


z=A(t)z+Bt(tu(t), (24.1) 


où z est le vecteur de dimension » des coordonnées de phase du sys- 
tème ; u (t), le vecteur de dimension r de la commande; À (ft), la 
matricen X n;B (t),la matricer X r. Supposons que les commandes 
uj (4) Ü = 1,:..,r) ne soient pas soumises à des contraintes. La 
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commande w (t) doit être choisie‘de façon à minimiser la fonctionnelle 
T 

Ji= (Tr), Fa(T) +5 | 10, CO z()+ (D, Ru (EH) de. 
to 


(24.2) 


Ici 7 est un instant fixé. La commande a pour but de maintenir 
les coordonnées de phase du système zx; (it) G = 1, ..., n) dans le 
voisinage du zéro, c'est-à-dire il s’agit d'assurer la régulation de 
l'état du système. F et Q (t) désignent des matrices n X n définies 
non négatives, c'est-à-dire des matrices symétriques vérifiant la 
condition (a, Fa) >0, (a, Q(t)a) >0 pour tout vecteur a # 0 
de dimension nr. La matrice R (t) est une matrice définie positive 
r X r, c'est-à-dire une matrice symétrique vérifiant la condition 
(b, R(t)b )>0 pour tout vecteur b = 0 de dimension r. 

Les conditions nécessaires d’optimalité de la commande x (t) 
peuvent s’obtenir à partir du principe du maximum de Pontriaguine. 


D'après (48.15), la fonction À -du problème que nous étudions s'écrit 


= 1 

H— 5 ble) (z (0), Q()z()+5 VU) (U(E), Ru (#)+ 
+(A4()z(t), PDG) +{(B(tju(t), p(#), (24.3) 

où + (4) est le vecteur de dimension »# dont les éléments sont les 

variables auxiliaires 4h, (4), . . ., Ÿn (4). La commande optimale u (t) 

doit maximiser la fonction À. D’après le principe du maximum appli- 

qué aux systèmes non autonomes, dans le problème à temps fixé et 


à extrémité libre de la trajectoire w, ({) = const — —1. C’est pour- 
quoi en introduisant la notation 


_ bi (8) 
pi (t) — . (i=1,...,n), (24.4) 
on obtient que la commande optimale w (t) minimise la fonction 
= rt), Oz) + UE, R(Du(#))+ 
| +(A(@z(), PO)+(B()u (0, pe). (24.5) 
Puisque 


oH 
OT}; 


Vi = Vop; = — (j=1,..., n), 
les éléments du vecteur p vérifient le système d'équations différen- 
tielles 


: 0 ; 
Pr U=l...,n). (24.6) 
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Les dérivées partielles par rapport à x; (j = 1,...,n) de la fonc- 
tion E = + (x (1), Q (t) x (t)), où Q (t) est une matrice symétrique, 
s’écrivent 

n 


=D Ont) (G=t,...n), 


Rk=1 
0€ dE 0Z 
T = Éd 
et le vecteur grad E — EE ES =.) est de la forme 


grad E = Q (t) zx (t). 
D'une façon analogue, pour la fonction £ = (A (t)z(t), p(t))ona 


_— = 5 4,50 pi (j=1,...,n), 
; Rk=1 


0£ 0 GE CE RER 
EE xs ? .., <=) s écrit 
grad Z = A* (t) p (t), 
où A* (t) désigne la matrice obtenue par transposition de À (f). 


Ainsi, conformément à (6) et à (5), le vecteur fonction p (t) satis- 
fait à l'équation différentielle 


et le vecteur grad z=| 


= —Q (t) x — A* (1) p. (24.7) 


Cherchons maintenant la commande x ({) qui extrémise la fonc- 
tion 7. Comme 


DT ; Ru (t) wi (#) + > Baj(t)pa(t)  (j=1,...,r), (24.8) 
1=1 
les conditions nécessaires pour l'obtention de l’extrémum 


C4 
ou j 


= 0 UT .::,7) 


sont de la forme 
2 Ra) u (= — À Bn;()pa@)  (G=t...r). (24.9) 


Le système d'équations scalaires (9) est équivalent à l'équation 
vectorielle 


R (t)u(t) = —B®% (t) p (t). (24.10) 
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L’équation (10) entraîne que la ‘commande (ft) qui fournit l'extré- 
mum à la fonction 4 est 


u (t) = —R"1(t) B* (bp (1). (24.11) 


Puisque R (t) est une matrice définie positive, det À (t) + 0 et il 
existe la matrice inverse R-! (t). 
D'après (8) 


0 è 
Gujan — Rin () (j, k=1, 3 r), 


et, par suite, la matrice 


APM der —R(t) (24.12) 


est définie positive. Il s'ensuit que la commande w (t), définie par 
l'expression (11), minimise la fonction éZ. 

Portons l’expression (11) de w (t) dans l’équation (1) et ramenons 
cette équation à la forme 


z=A(tz—S(tp, (24.13) 
où S (i) est une matrice symétrique r X n: 
St) =B(t) R7!(t) B* (6). (24.14) 


Les équations (13) et (7) forment un système d'équations différentiel- 
les vectorielles qu’on peut écrire 


pe | er re 
. | = . .19 
PJ" L-06—4"&]L? bé. 
L'équation différentielle vectorielle (15) décrit précisément le sys- 
tème optimal recherché. 

L'état initial x (4) du système (1) est supposé connu. Pour cette 


raison la solution du système (15) de rang 2 doit vérifier nr con- 
ditions initiales définies par la relation vectorielle 


[z (élite = 2 (to). (24.16) 


Pour les variables auxiliaires p, (j = 1,...,n), les n conditions 
aux limites qui résultent des conditions de transversalité sont définies 
par la relation 


p(T) = Fz (D). (24.17) 


Les conditions (16) et (17) déterminent la solution unique du 
système d'équations (15). 
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Montrons comment obtenir la condition aux limites (17). Ramenons au 
préalable la fonctionnelle (2) à la forme exempte du terme additif qui dépend de 
z (T). Etant donné que 


T 
: (z (T), Fz (T)) = + (z (to): Fz (to)) + Î _ Ë (z (4), Fz (t) ] dt, 
do 


SG, Fe w)] = (Fz(t), z (0), 


on a 
T 
3 EU, Fe (D) = + Ge (tu), Fa (t)) + | (F2 (0, 2) de (24.18) 
to 


_e tenant compte de l'identité (18) on peut ramener la fonctionnelle (2) à la 
orme 


T 
= À (ae (to), Fe (+ { [ (Fe (), z(9)+ 
to 


++ EU 0 @zO)+ + UE, ROuG)]&. (2449) 


La fonction & définie par l'expression (5) peut être remplacée respectivement 
par la fonction 


B= + (UE) Oz ()+ 5 GC R (D u (D)+ 
+ (Fe (0, 2 (9) + Cp, LA (6 2 (9 + B (9 u (D). 


Comme d’après (1) 
z() = A(t)z(t)+B(t)u (rt), 
la fonction S s'écrit 


= (az (t), Q (2 0) + à Cu (6), R (D u (9) + | 
+ ({Fz(+P] (A(Oz(+B(Du(r]l) (24.20) 


Puisque les fonctionnelles (2) et (19) se déduisent l’une de l'autre à l’aide de la 


transformation identique, les fonctions & et € doivent coïncider. A cet effet, 
comme il résulte des expressions (5) et (20), il faut que la condition 


p(9 = Fz(t)+p( (24.21) 


soit observée. Lorsque la fonctionnelle à minimiser est de la forme (19), les con- 
ditions de transversalité du problème à temps fixé et à extrémité libre de la 
trajectoire conduisent, d'apres (17.55), à la relation 


P(T)= 0. (24.22) 


Dans ces conditions, conformément à (21), le problème initial à fonctionnelle 
(2) donne lieu à la relation (17) 


P(T) = Fz(T). 
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Cherchons encore l'équation différentielle vérifiée par le vecteur fonction p (t) 
du problème à fonctionnelle (19). D'une façon analogue à (6) 


d > ER 
a Pi oz =: n). (24.23) 
Comme 
Fi Aij | 
a Fa A 
Ze 4 FT, 404 #  Fe, 
L_ Fnj À Anj 


compte tenu du fait que F est une matrice symétrique, c'est-à-dire que F* = F, 
on a 


grad (Fz, Az) = FAz + A*Fz. 


Le système d'équations différentielles (23) peut donc être mis sous la forme 
de l'équation différentielle vectorielle 


_ p=—Q{t)z— A*(t)p —FB (t) u—FA(t)z—A*(t) Fz (24.24) 


ou 


TP = —Q(t)z—Av(t) (Fr+p)—F[A(t)z+B (+) ul. 


Puisque d’après (1) 

z(t) = A(t)iz+Bi(t)u, 
l'équation (24) se ramène à la forme 

d Les LS 
PT Fr) = —Q(t)z— A* (4) (p-+ Fz), 

d'où, en vertu de (21), on obtient l'équation (7) 

p=—Q(z— A*()p 
du problème initial à fonctionnelle (2), ce qu’il fallait précisément démontrer. 

Revenons maintenant aux équations différentielles (7) et (13) 


p=—Q(z— A* (1 p, 
z=A(t)z—S (tp. 
Cherchons p (t) sous la forme 
p (t) = K (t)z (+), (24.25) 


où X (i) est une matrice z X n à déterminer. Dans ce cas l'équation 
(13) devient 


z=(4A(D—S(K(t}z. (24.26) 
La relation (25) entraîne 
pP(T)=K(T)z(T). (24.27) 
En comparant les expressions (27) et (17), on trouve que 
K(T) = F. (24.28) 


20—0393 
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Les équations (7) et (13) permettent d'obtenir l'équation différen- 
tielle vérifiée par la matrice XÆ (t). En portant dans ces équations 
l'expression (25), on obtient 


À (0 z (0) + K (6) À (1) x (9) — K (9) S (6) Æ (1) z (9) = 
— —Q(hz()—A*(D)K(Dz(. (24.29) 
Compte tenu du fait que d’après (14) 
S(t)=B(t) R-1(t) B* (1), 


l'équation (29) peut être ramenée à la forme 


LA (9 + K (9 À (6) + A* (9) K (9 — 
—K (D B(D R1(B* (D K(D) +Q(t)lzx(t) = 0. (24.30) 
La relation (30) doit être respectée quelle que soit la valeur de z (1), 
d’où l’on déduit que la matrice Æ (t) doit vérifier l'équation diffé- 
rentielle 
(——KA()— A) K+KB(DR1(DB*(DK—Q(L) 
(t(E [to TD. (24.31) 
L'expression (31) est une équation différentielle matricielle non 
linéaire de Riccati. Avec la condition aux limites (28), l'équation (31) 
détermine univoquement la matrice X (+). 

Montrons encore que la matrice X (t) est symétrique. En trans- 
posant les matrices du premier et du second membre de (31) et en 
retenant que B (t) R7!(t) B* (t)et Q (t) sont des matrices symétriques 
et que 


LA (01° = LA * (6), 
on obtient l'équation 
K*= — K*A(I)— A° (#) K°+ 
+ K*B (+) R°1(0) B° (0 K°—Q(#) (HE, TD. (24.32) 


Comme la matrice F est symétrique, la condition aux limites (28) 
devient 

K* (T) =F. (24.33) 

Ainsi les équations différentielles et les conditions aux limites 

vérifiées par Æ (t) et X* (t) coïncident et, en vertu du théorème d’u- 
nicité, 

K (t) = K* (1), (24.34) 
c'est-à-dire À (t) est une matrice symétrique. 
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En vertu de (26) et (14), .l’équation différentielle qui définit 
la loi du mouvement d’un système optimal est 


z={(A()—B()R<1(t B*(t) K()z. (24.35) 
Montrons maintenant comment la matrice X (4) est liée à la matrice fonda- 


mentale Ô (:) des solutions de l'équation différentielle vectorielle (15). Dési- 
gnons par Q (t, t) la matrice 2n X 2n 


Q(t, t) = (4) 8-1 (x). (24.36) 
L'équation (15) a pour solution 
z(t) 1] z (to) 
RACE (24.37) 
D'une façon analogue à (37), on a pour T>t 
z(T) 7) _ z (1) 
AE t) [ p(t) J° (24.38) 


En mettant la matrice Q (7, t) sous la forme d’une matrice partitionnée 
dont les éléments sont des matrices n Xn: 


Q st » 
Ou (79 5) Get, 9 J' (24.39) 
on obtient à partir de (38) et (17) les relations 
Zz(T)—= Que (Ts t)z (t) + Que (To t) p(t)s (24.40) 
P(T)=Fz(T)=Qo (Ts t)z (t)+Qpoe (T, t) p(t). 
Des relations (40) résulte que 
P (+) — {[Qss (7, t) mn Fa (7, 1) ns [FQ1: (T, t) a Q21 (7, t)]} æ (4). 
(24.41) 
Puisque Q (7, T) = En, où E2, est la matrice unité 2r X 2n, il vient 
Qu (Ts, T)= Que (To T)= En) 
Qi2 (To T)=Qo1 (Ts T) = 0, 
où E, est la matrice unité n X net (41) conduit à 
P(T) = Fz(T), 
ce qui coïncide avec l'expression (17). 
La comparaison des expressions (41) et (25) donne 
K (+) = [Qsa (Ts 0) — PQ (Ts DV FO (T, 1) — Qu (T, 0]. (24.42) 


La matrice Q (7, t) peut être calculée par intégration de l'équation diffé- 
rentielle vectorielle conjuguée de l'équation différentielle vectorielle (15) [68]. 

Dans le cas où 4, B, Q et R sont des matrices constantes, la construction 
de la matrice fondamentale 6 (1) ne présente aucune difficulté et la matrice 
Q (T7, t) peut être définie sous une forme fermée. Le système optimal décrit par 
l'équation différentielle vectorielle (35) est un système linéaire ; toutefois, même 
dans le cas où 4, B, Q et R sont des matrices constantes, ce système optimal 
sera non stationnaire. 


Q(T,t)= 


20° 
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Passons maintenant à la détermination de la valeur minimale 
Ji (x, t) de la fonctionnelle 


T 
Jia, D= ZT). Fr(Th ++ | LE), QE) z ED + 
t 
+(U(E), R(E)u(E)DIdE (tEléo, TI). (24.43) 


Montrons que 
JT 0=7GO,K(Oz() (lt, TD, (24-44) 


où X (t) est la solution de l'équation de Riccati (31) sous la condition 
aux limites (28). Dans ce cas, compte tenu de (28), on a 


JT), D=+ &(T), Fz(T)). (24.45) 


Pour montrer la validité de l'expression (44), composons l’équa- 
tion de Bellman pour le problème considéré. D'après (14.21), cette 
équation s'écrit 
E-+ min {5 (0, QU) 2 (0)+ Zu (9), Ru (+ 
+(A()z(), grad J} (x, t))+(B(t)u(r), grad J? (x, 1) }=0. (24.46) 


L'expression entre accolades de l'équation (46) coïncide avec l’ex- 
pression (5) qui définit la fonction &£ si l'on y remplace le vecteur 
p (t) par le vecteur grad J? (x, t). Conformément à (11), la commande 
minimisant cette expression est 


u (t) = —R"1 (1) B® (+) grad Ji (x, t). (24.47) 
Comme d’après (44) 
= =< E x, K (#) 2) | =+ (x, K (£) x), 
grad J? = grad [+ (x, X (1) 2) | = K (t)z, 
la formule (47) se met sous la forme 
u (t) = —R"1(1) B* (t) K (+) z (t). (24.48) 
FE des (46) pe s'écrire 


+ (6. K (#)z(#)++ (z (2), Q()z (8) + 


de L (R71()B*() K(t)z(t), B°(#)K (6) z(t))+ 


+ (4 (4) z(e), K(e)z(t))— 
—(B(t) R1(t)B*(t)K (t)z(t), K (8)3(t))}—=0. (24.49) 
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Pour transformer les équations (49) on recourt aux identités 
(R-1B°Kz, B*Kz) = (R-\B*Kz)* B*Kz — 
— (BR-1B*Kz)* Kz = (BR-1B*Kz, Kz), (24.50) 
(z, KAz) = z°KAz = (K*z)* Az = (K°z, Az) = (Kzr, Az) = (Ar, Kzr). 
Nous avons tenu compte ici du fait que d'après (34) X = K*. D'une façon ana- 
Fri (z, A°Kz) = z*A*Kz = (Az)* Kz = (Az, Kz). 


IL suit des deux dernières identités que 
(Az, Kz)=+ (a, A°Kz)+ 5 (a, KAz). (24.51) 
A l'aide de (50) et (51) on peut réduire l’équation (49) à la forme 
LU), (D z(#)+ + (x (8), Q (6) x (#))+ 
+240, A° (0 K (7 (0)+ Lx 0, À (0 Az) 
—Z(:(), K(B()R(DB° (OK(Hz(0)=0. (24.52) 


« 


Ainsi, conformément à (44), l'équation de Bellman (46) devient 
+), LÉ (O+K (0) A (+ A" (N K(— 
—K(t)B()R°() LA (D+Q(]1z(#)=0. (24.53) 


Comme Æ (t) est une solution de l'équation de Riccati (31), l’expres- 
sion entre crochets de l'équation (53) est identiquement nulle et, 
par suite, la fonction J? (x, t) déterminée par l'expression (44) est, 
dans notre problème, une solution de l'équation de Bellman. 

Ce qui vient d'être dit montre que la fonction J? (x, t) vérifie 
l'équation de Bellman (53) quelles que soient les valeurs de ses 
variables: x (f) € X (où X est un espace de phase de dimension n) 
ettE lt, T1]. On peut prouver [14] (d’une façon analogue au théorème 
du $ 15) qu'il s'ensuit que la commande (48) satisfait aux conditions 
nécessaires et suffisantes d'optimalité et que cette commande est 
unique. 

Montrons encore que pour {€ [f,, T) la matrice X (t) est définie 
positive. F et Q (t) étant des matrices définies non négatives, et 
R (t) une matrice définie positive, d’après (43) la fonctionnelle 
J, (x, t) présente, quelle que soit la commande u (t) = 0, une valeur 
positive pour tout 4€ [é,, T). Par conséquent, pour tout vecteur 
x (t) la valeur minimale J? (x, t) de la fonctionnelle J, (x, t) définie 
par l'expression (44) est 


Ha D=3EU.KEz()>0  LElt T). 


Il en résulte que la matrice X (t) est définie positive pour t € [to, 7). 
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Calcul de la valeur limite de p(T) pour le cas 
HRRULR du problème à temps fixé et à extrémité 
ibre de la trajectoire. Dans le cas général l'équation du mou- 
vement du système s'écrit 


z = f(z, u,t), (24.54) 
où f et z sont des vecteurs de dimension n, et u le vecteur de dimension r. 
Soit 
| TT 
=N(&(T), T)+ [ L(z(t), (9, t)dt (24.55) 


to 


la fonctionnelle à minimiser. D'une façon analogue à (5), la fonction £ à 
minimiser par la commande optimale est de la forme 


P=L(z,u,t)+4(p, f(x, u, t)). (24.56) 


Comme 


N'(&(T), T)=N (e (to), 1)+ | À N (z (0), t)dt, 
to 


d * , ON aN 
= N(t), t)=(grad N, 2) + =(grad N, f(zs u,t))+—, 
on a 


T 
ND, TN (a (eo), t0)+ | [égraë W, fe, v, + ]é. (24.51) 
to ‘ 
La fonctionnelle ee se réduit à la forme 
FN (& (to), to) + [egrad N, fee, u, ++ Le, u, 1) |. (24.58) 


Maintenant il faut eo . la fonction & par la fonction 


SE —(grad N, f(z, u, + + L (a, u,t)+(p, f(z,u,t)} (24.59) 


Cherchons l'équation M qui doit être vérifiée par le vecteur fonc- 
tion pit). Puisque 


Td — = Ôz) (j = 1, ? n) 
on a 168 
dpi 92N Là ,- 
ar = (grad N, f(x, u, Dot dej dej f(z, u,t)) 
ou 
ds ’ > Of(z, u, AE RIN 
L= grad À, f(x, u, t) grad N, 0z) 


ON 0L = ôf(z,u,t) 
re (6: TE )- (24.60) 
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Montrons que le vecteur p(t) qui intervient dans l'expression (56) est 


p(t)=p(t)+grad N (x, ?), (24.61) 
c'est-à-dire que 
= N 
pi(t)-=p; O+ TE (j=1,...,n). (24.62) 
On tire de (62) et (60) 
P=— nn grad N, f(x, u, 0) — Çarei N, PEER ON 
ON ôL ôf(z, u,t) d ON 
Puisque 
d ôN fe) ° O2N 
dt 0j Ôzx; grad W, 2)+ 0x} Ôt ä 


2 
gra N, f(x, u, D) + , (24.64) 


=(—+ 
== 


e 0L ô , , 
pe 5 Çp, TEE (j=1,...,n), (24.65) 
ô 


l'équation (63) devient 


OZ ; 
soit 
C 


ET (j=1, ET n), (24.66) 


Pj=— 


où la fonction & est déterminée par l'expression (56). Ce résultat montre que 
la relation (61) est vraie. 

Lorsque dans un problème à temps fixé et à extrémité libre de la trajectoi- 
re la fonctionnelle à minimiser est de la forme (58), d'après (17.55) les condi- 
tions de transversalité conduisent à la relation 


p(T) = 0. (24.67) 

De plus, conformément à (61), pour le problème initial à fonctionnelle (55) on 
a la relation 

p(T)=gradN(z(T), T). (24.68) 


2. Problème du régulateur de sortie. Considérons le système li- 
néaire non stationnaire 


z=A(t)zx B (t) u (t), 
(4) z + B (t) u (1) | (24.69) 
y=C(t)z, 

où x est le vecteur de dimension » des coordonnées de phase du sys- 
tème (c’est-à-dire son vecteur d’état) ; u (4), le vecteur de dimension r 
de la commande; y (t), le vecteur de dimension m qui détermine la 
sortie du système ; À (é), la matrice z X n;B (t), la matricen X r; 
C(t), la matrice m Xn. On suppose que le système (69) est complète- 
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ment observable, c'est-à-dire que la matrice 
T 
M (to, T)= | D° (4, to) C* (4) C (4) D (t, to) dt (24.70) 
lo 


est définie positive. Ici 
DE, +) = 6 (4) 87 (r), 


où 6 (4) est la matrice fondamentale des solutions de l’équation dif- 
férentielle vectorielle 


z = A (t)z. 


De même qu’au point 1, on suppose que les commandes u,; (t) (j = 
= 1,...,r) ne subissent pas de contraintes. On demande de choisir 
le vecteur de commande w (t) tel qu'il minimise la fonctionnelle 


T 
Je UT), FT +7 | LU, Cu) + 


+Qu(), R(Du(b)ldt, (24.71) 


où 7 est un instant fixé. Le but de la commande est de maintenir le 
vecteur y (t) dans le voisinage du zéro, c’est-à-dire le problème con- 
siste à régler la sortie du système. Les matrices F et Q (ft) sont des 
matrices définies non négatives m X m, et la matrice R (t) est une 
matrice définie positive r X r. Comme 


(y (4), Q () y &)) = (C (8 x (4), Q (0 CE) x (0) = 
= (z(t), C* (HD O(DC(zt(t)), 
(y (T), Fy (T)) = (x(T), C*(T) FC(T) x (T)), 
la fonctionnelle (71) peut s’écrire 


Ja = ST), C(T)FC(T)z(T))+ 


T 
+3. (ti), C*(DO(H)C(tH)z(t)+tu(t), R(t)u (t)}]dt. (24.72) 
to 


Constatons que puisque F et Q (ft) sont des matrices définies non né- 
gatives, les matrices symétriques C* (T) FC (T) et C* (4) Q (t) C (t) 
sont également des matrices définies non négatives. 
Par suite, 
(x (T), C*(T)FC(T)z(T))>0 (24.73) 


(x (), C* (DH Q(BC(Hz(t))> 0. (24.74) 
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Si le système est complètement observable, on peut déterminer d’une 
façon unique d’après le vecteur fonction y (t) dans [0, T7] le vecteur 
initial z (4) du système (69), alors que tout vecteur zx (f,) définit 
une trajectoire unique z (t) de (69). Par conséquent, les équations 
(69) d’un système complètement observable définissent une applica- 
tion biunivoque de l’espace Y dans l’espace X et la condition d’ob- 
servabilité complète assure ainsi l’unicité de la commande optimale 
d’un problème de régulation de la sortie d’un système. 

La différence entre les fonctionnelles (2) et (72) ne portant que 
sur le fait que les matrices définies non négatives F et Q (t) sont 
remplacées par les matrices définies non négatives C* (T) FC (T) 
et C* (1) Q (t) C (t) respectivement, les résultats du point 1 peuvent 
être appliqués au problème examiné. 

D'une façon analogue à (48), la commande optimale est de la 
forme 


u (t) = —R"1(1) B* (4) Æ (1) zx (1). (24.75) 

L'équation différentielle régissant le mouvement d’un système opti- 
mal est, d’après (35) et (69), 

z=(A(Hh—B(t) R1(t) B* (1 & (k)]z. (24.76) 


La valeur minimale J? (x, t) de la fonctionnelle J, (x, t), définie 
d’une façon analogue à (43), est 


(2, D=5 (0), Æ(Dz(, #Elé TI. (24.77) 


La matrice symétrique définie positive € (t) qui intervient dans les 
expressions (75) et (77) et dans l'équation différentielle (76) est la 
solution de l'équation de Riccati 


= —HA(t)— A°(t) ZX + AB (t) R°1 (Et) B*\(t) Æ — 
—C*(HQ()C(E)  (£Eléo TI, (24.78) 
qui vérifie la condition aux limites 
Æ (T) = C*(T) FC (T). (24.79) 


3. Systèmes stationnaires à temps infini d'observation. a) R é - 
gulation de l'état d'un système. L'équation du 
mouvement du système s'écrit 


z = Az + Bu. 
Considérons le cas limite où l'extrémité de l'intervalle d'observation 
T — oo. Dans ces conditions, la fonctionnelle à minimiser s'écrit 
T 


Je = glim | (2(6), Qz())+ tu (#), Ru (#)1 dé, 


T—00 0 
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où Q et R sont des matrices définies positives constantes. .La com- 
mande x (!) n’est soumise à aucune contrainte. On suppose que le 
système est complètement commandable, soit 


rang (B AB...Ar-1B] — n. 
L'équation de Riccati (31) devient 


K = —KA — A*K + KBR-B*K — Q. 

Étant donné que dans la fonctionnelle J., contrairement à la 
fonctionnelle (2), F# = 0, la condition aux limites (28) peut s’écrire 
K (T) = 0. 

La solution de l’équation de Riccati vérifiant la condition aux limi- 
tes À (T) = 0 se note Æ (1; 0, T). Comme il suit des résultats fournis 
par Kalman [34], dans le cas des systèmes stationnaires complète- 


ment commandables, pour F = 0, cette solution possède une limite 
pour 7 — co 


lim X(t:0,T)=k, 


T—00 


où X, matrice définie positive symétrique constante, est la solution 
de l'équation algébrique matricielle non linéaire 


— KA—A*R+KRBR B*K—Q=—0. 
D'une façon analogue à (48), la commande optimale est de la forme 
u(t) = —R-1B*Kz (1). 
L'équation différentielle du mouvement du système optimal est 
z = (A — BR-iB*k) x, 


de plus, le système optimal est asymptotiquement stable, c'est-à-dire 


lim x (t) = 0. 
00 
La valeur minimale J£ (x, t) de la fonctionnelle 


Je (2, 9 =+ À (x (E), Or (ED) + tu, Ru (E)IdE 


{ 
est, de façon analogue à (44), 


Jo (x: = 7 (x (e), Àz(t). 


b) Régulation de la sortie d'un système. 
Un système est décrit par les équations 
z = Az + Bu, 
y = Cz. 
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On demande de minimiser la fonctionnelle 
T 


Ta = lim À Ky (6), Que) +(u (8), Ru (EI de. 
0 


où Q et R sont des matrices définies positives constantes. La com- 
mande u (t) ne subit aucune contrainte. On suppose que le système 
est comlètement commandable et complètement observable, soit 


rang (BAB...Ar-1B] = n, rang [C* A*C*... A%n-iC®] = n. 


D'une façon analogue au problème précédent, au cas limite pour 
T — o la commande optimale est 


u (i) = —R BY zx (t), 


où la matrice définie positive symétrique constante &# est la soln- 
tion de l'équation algébrique matricielle non linéaire 


— HA— A'X + H BR AB*H — C*QC —0. 
L'équation du mouvement du système optimal 
z=(4 — BRIB*Ÿ) x. 
Le système optimal est asymptotiquement stable, c'est-à-dire 
lim z(t)=0. 


La valeur minimale J* (x, t) de la fonctionnelle 


To (x, D= 4) LC (E), QC (E))+(u(E), Ru (EI dE 
est 
Ta (2,1) = (2 (0), Ex (0). 


&. Problème d’asservissement [34]. Examinons le système linéai- 
re non stationnaire 


z=A(t)z+Bl(t)u(e), 
y=C(t)z, | 


où zx est le vecteur d’état de dimension n ; u (t), le vecteur de comman- 
de de dimension r; y (t), le vecteur de dimension m qui détermine 
la sortie du système; À (ft), la matrice nr X n; B (t), la matrice 
n Xr; C(t), la matrice m X nr. On suppose que le système (80) 
est complètement observable, c’est-à-dire que la matrice M (t,, T) 
du type rz7 X n déterminée par l'expression (70) est une matrice dé- 
finie positive. 


(24.80) 
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Désignons par z(t) le vecteur de dimension m muni d’une loi 
de variation dans le temps donnée de l'extérieur et qui présente la 
sortie cherchée du système. Le vecteur 

e (t) = z (t) — y,(t) (24.81) 


est l’écart ou l'erreur du système asservi. 
Sous l'hypothèse que la commande u (t) n’est soumise à aucune 
contrainte, on demande de minimiser la fonctionnelle 


Ja= ZT), Fe(T))+ 
T 
+7 [le(, QUeU+U(, RHu(Id, (24.82) 


où 7 est un instant fixé. Ainsi, le but de la commande est de main- 
tenir l'écart du système, c’est-à-dire le vecteur e (£), dans le voisina- 
ge du zéro. Les matrices F et Q (ft) sont des matrices définies non né- 
gatives m X m, et la matrice R (it) une matrice définie positive 
TXT. 


En remplaçant dans (82) e (t) par l'expression 
e(t =2z(}) —C(t)z(t), (24.83) 
ramenons la fonctionnelle (82) à la forme 


Ja= + (2(T)—C(T)2(T)}, F (2 (T)—C(T)z (TM) + 


T 
cr CAO ACEOIN ICI TOMATE 
+(u (D, R(Du(D)}dt. (24.84) 


La commande optimale uw (f) doit minimiser la fonction Se qui se 
construit d'une façon analogue à la fonction 4 définie par l’ex- 
pression (5). La fonction dc associée à la fonctionnelle (84) s’écrit 
mn _ 1 

= Luz (CE 7 (1 Q (0 120) —C (6 x (DD + 


LT (2), R(éju(#)) + (A (8) z(é), p(é)) + 


+{B(t)u(t), p(t)). (24.85) 
Les relations (8)-(11) conservent leur forme pour le problème en- 
visagé également et conformément à (11), la commande u({) mini- 
misant la fonction éZ est 


u (t) = —R-1(t) B* (t) p (t). (24.86) 


LS 
© 
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En portant l'expression (86) de u:(f) dans la première équation (80), 
on met cette équation sous la forme 


z=A (t)z—S (t) p, (24.87) 
où 
S(t=B(t) R"1(t) B* (+1). (24.88) 
Comme … 
D= — 7 Ut 2:20), 


j 
le vecteur fonction p (t) vérifie l'équation différentielle 


p=—C*(hQ(HC(Dz—A*(p+C* (DQ(z(H. (24.89) 
En introduisant les notations 
VÜH=C*HQUHDC(E, W(D =C*(HQ(), (24.90) 


on peut écrire (89) sous la forme 


= —V(z— A*(p+W(tz(t. (24.91) 


Les équations (87) et (91) composent un système d'équations diffé- 
rentielles vectorielles qui peut se noter 


El-L6 el Hwosgl ets 


La solution du système d'équations différentielles (92) de rang 
2n doit vérifier r conditions initiales définies par la relation vec- 
torielle 


[x (#)l=to = TZ (£o). (24.93) 


Conformément à (68), (55) et (82), les conditions aux limites des 


variables auxiliaires p, (j = 1, ..., nr) sont déterminées par la 
relation 


(ne {5 [5 (0, Fe(]}, (24.94) 
Puisque 


T(e(#), Fe(}=5(z(s), F2(0)— 


—(2(9, FC (2 (0) + (6), C° (6) FC (6) x (0)), 
d’après (94), pour le vecteur fonction p (t) on a la condition aux 
limites 

P(T)=C*(T)FC(T)z(T) — C*(T) Fz(T). (24.95) 


Désignons maintenant par 6 (t) la matrice fondamentale des solutions de 
l'équation différentielle vectorielle homogène qui se construit à partir de l'équa- 


tion (92) avec z (t) = 0. Notons Q (1, t) la matrice 2n X 2n 
Ge, r)=6 (+) 0-1 (x). (24.96) 
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La solution de l'équation (92) s'écrit 


t 
Be u[]ef 80 [eus] 6657 
to ; 


D'une façon analogue à (97) on a pour T>1t 


T 
ECARULIETSE 8 ny) Elie 71) 
(24.98) 


En représentant la matrice Q (7, t) du type 2rnX2n sous une forme parti- 
tionnée dont les éléments sont des matrices nXn 


Qi (Ts t) Quel, LA 


Q(7, o=[ _— 
Qo1 (Ts t) Qo2 (Ts t) 


(24.99) 


on peut réduire (98) à la forme 


| z(T) ]- Es (T, #)2 (8) + Que (T, #) da +| r'i(t) | (24.100) 
| P(T) Qos (T, t)z (1) +Qse (Ts t) p(t) Te (+) 
ou 


T 
r = | Dp(T, TD W)ztér (=, 2). (24.101) 
t 


Il s'ensuit de (100) que 
2 (7) = Gn(T, 929 + Bar, Hp(O+Tit) (24-102) 
P(T)= Qu (T, D (9 + Gsa(T D PO + Ta(0. (24-108) 
En substituant dans (103) à p (7) l'expression (95), on obtient la relation 


[C® (T) FC (T) Que (Ts ?) — De (Ts 1 p (1) = 
= [—C* (T) FC (T) Qua (Ts ?) + Gas (Ts t)z (t) — 
_ C“(T)FC(T)Di()+Ts( + C*(T)Fz(T). (24.104) 
Puisque 
QT, T)= Gua(T, TD)=E, 
Que (Ts, T)= On (T, T)= 0, 
1 (7) = 0, F3 (7) = 0, 
pour t = 7 la relation (104) se met sous la forme (95) 
p(T)= C*(T)FC(T)z(T) — C® (T) F:(T). 
La relation (104) entraîne que le vecteur fonction p (t) peut s'é- 
crire 
p(t)=K(t)z() —8g (it); (24.105) 
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de plus, en vertu de (95), 
K (T) = C* (T) FC (T), (24.106) 
g(T) = C* (T) Fz (T). (24.107) 
Cherchons maintenant les équations différentielles vérifiées 
par la matrice X (t) et le vecteur g (t). D'après (105), on a 


PH=K(Oz(t) + K(Hz(t) — g (6. (24.108) 
Conformément à (87) et à (105), l'équation (108) peut être ramenée 
à la forme 
pt = X (D z() + K (0 À (9 z (O— 

— KG SG K(Gz(G)+K(G)S()g(t—g(t). (24.109) 


En éliminant P des équations (109) et (91) et en remplaçant p (+) 
par l'expression (105), on obtient la relation 


LA (4) + K (9) À (9) + A% (8) K (9) — K (#) S (#) K (9) + 
+ V ()lz (i) — {g (6) — (K (8 S (6) — A* (lg (4) + 

+ W(t)z(t)} = 0. (24.110) 
La relation (110) ayant lieu quels que soient z (t), z (t) et t, il faut 
que soient remplies les conditions suivantes: 
K (9) + K (4) À (9 + A% (1) K (D — K (1) S (9) K (1) + V (9 = 0, 

(24.111) 

g() — (X (1) S (6) — A (lg (0) + W (2 z (8) = 0, (24.112) 
c'est-à-dire Æ (t) et g (t) doivent être des solutions des équations 
différentielles (111) et (112). 

En remplaçant S (+), V (t) et W (t) par les expressions (88) et (90), 
on obtient que la matrice Æ (t) est une solution de l'équation diffé- 
rentielle de Riccati 
K = —KA(t)— A*( K + KB (t) R-1(t) B* (t) K — 

— C*(HQO(C(E) (tE [to TD, (24.113) 
qui vérifie la condition aux limites (106) 
K (T) = C* (T) FC (T). 

Le vecteur fonction g (t) est la solution de l’équation différen- 
tielle 
g=—l4 (9) — B (+) R° (1) B* (1) K (I 8 — 

— C*(DQ(Dz() (Et, TN, (24.114) 


qui satisfait à la condition aux limites (107) 
g (T) = C® (T) Fz (T). 
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L’équation différentielle qui, conformément à (87), (88) et (105) 
décrit la loi du mouvement d’un système optimal, est de la forme 


z=[(A(D —B(t) R1(:) B* (0 K (tx + 
+ B(t) R71(t) B* (à g (à) (Et, TD. (24.115) 
D’après (86) et (105), la commande optimale vw (t) s'écrit 
u(t)=—R1(t) B* (D K(t)z(t + R1(1 B* (D g(t). (24.116) 

Notons que l’équation différentielle (113) ne possède pas de termes 
dépendant du signal d’entrée z ({). Ainsi, la matrice X (t) ne dépend 
pas du signal d'entrée z (+). 

Pour déterminer d’après (116) la commande optimale u (f) ainsi 
que pour intégrer l'équation différentielle (115), il faut connaître la 
fonction g (f), ce qui exige l’intégration de l’équation différentielle 
(114). Désignons par Ÿ (f) la matrice fondamentale des solutions de 
l'équation homogène qui se construit à partir de l'équation (114) 
avec z (t) = 0. Introduisons la notation + (4, t) pour la matrice 

d (4, t) = Ÿ (1) 0! (Tr). (24.117) 
La solution de l’équation vectorielle (114) s'écrit alors 


T 
e(T)=b(T De] (TD C(HOMz(T dr (24.118) 
t 
(é € {lo, T)). 


Comme 
DT, =, 7), pe T)p(T, t) = (4, 7), 
(118) conduit à 


T 
= bp T)e(T)+ | D, DC (MO) z (mdr, 


ou, en vertu de (107), 
BD, T)CA(T) FE(T)+ À pe ©) Ce (x) Q(D 2 (x) de (24.119) 
[4 
(4€ [fo, T]). 


L'expression (119) montre que la valeur courante de g (t) ne peut se 
calculer que si l’on connaît le signal d’entrée z (t) dans l'intervalle 
de temps futur {t, T]. Par conséquent, pour rendre possible la détermi- 
nation de g (t) dans l'intervalle de temps {f,, 7], on doit connaître à 
l'instant même ft, le signal d'entrée z (t) dans tout l’intervalle de 
temps futur [t,, T]. La nécessité des renseignements préalables sur 
l’évolution du signal d’entrée z (t) est conditionnée par la forme (82) 
de la fonctionnelle J, à minimiser dans le problème donné. 


CHAPITRE 6 


SYSTÈMES STOCHASTIQUES 


25. Transformation des signaux aléatoires 
par des systèmes linéaires 


Das de nombreux problèmes le signal appliqué à l'entrée d’un 
système de commande est la réalisation d'un certain processus aléatoire 
dans des conditions où on ne possède aucun renseignement sur cette 
réalisation, sauf celui relatif aux propriétés statistiques du proces- 
sus considéré. Ainsi, par exemple, on peut savoir que le processus mis 
à l'étude est gaussien, on peut connaître sa valeur moyenne et sa 
fonction de corrélation. 

Un tel volume de renseignements sur le signal d’entrée ne suffit 
pas pour obtenir une information plus complète sur le signal de sortie. 
Il ne permet que de définir ses propriétés statistiques. 

Si le système est régi par des équations différentielles linéaires, la 
tâche consiste à déterminer les propriétés statistiques des intégrales de 
ces équations différentielles d'après les propriétés statistiques de leurs 
seconds membres. La résolution de ce problème est donnée dans ce 
qui suit. 

Bien plus grandes sont les difficultés que présente la résolution 
du problème qui consiste à déterminer les propriétés statistiques des 
intégrales des équations différentielles dont non seulement les seconds 
membres, mais encore les coefficients sont des processus aléatoires 
(fonctions du temps aléatoires). 

La résolution des problèmes de ce type pour des équations diffé- 
rentielles non linéaires n’est possible qu'en recourant aux méthodes 
approchées. 

Examinons un système linéaire monovariable dont la fonction 


de transfert D (D) (où D — =) est une fraction régulière et dési- 


gnons par k (t) la fonction de poids de ce système. Comme nous l'avons 


montré au $ 4, la fonction p (p) est la transformée de Carson- 
Heaviside de la fonction k (+): 


p® (p) + k(t), (25.1) 
soit 


D(p) = k(t) e-?! de. (25.2) 
0 


‘21—0393 
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Pour un système stable, l'intégrale impropre | k (t) dt est abso- 


lument convergente 
IRLUIL ESS 


et la transformation de Fourier pour la fonction k (t) s'écrit 
D (iw) = | k(t)e- int dé. (25.3) 


Si l’on désigne par  (t) le signal d’entrée, le signal z (1) à la sortie 
du système, qui à l'instant t = ?, était en équilibre, est égal à 


t t—to 
(= [rt-Tptar= | kE)PE-E dE. (25.4) 
to 0 
A la limite, pour {, = —, on a 


t t—to 
z(= lim Jet-Do(mér= lim k(E)(£—E) dE, (25.5) 
et 0 — © 


ce que nous allons noter, pour abréger l'écriture, 
t co 
(= | kG—Dp(ar= | k(E)pU—E SE. (25.6) 
- © 0 


L'expression (6) détermine un processus stationnaire dans ce sys- 
tème. Puisque k (t) = 0 pour t << 0, l'expression (6) peut se mettre 
sous la forme 


= | AG—-Domé= | kEPU-HAE. (25.7 


Dans ce qui suit nous allons supposer que le système étudié cest 
stable. Soit un signal d'entrée @ (t) produit par un processus aléatoire 
borné. Etant donné que toute réalisation d’un processus aléatoire 
borné est une fonction bornée du temps, pour toute réalisation d’un 
processus aléatoire  (t) 


r(t) = | k (E) p(1—E) dE < 00. (25.8) 
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L'expression (8) est une relation entre le processus aléatoire  (t) à 
l'entrée du système et le processus aléatoire zx ({) obtenu à sa sortie. 

Supposons que le signal d’entrée soit produit par un processus 
stationnaire aléatoiré. L'espérance mathématique de ce processus 
M [p (t)] = m, = const. Le processus stationnaire à la sortie du 
système, déterminé par la relation (7), est également un processus 
aléatoire stationnaire tel que 


ML GO1= À EE Mir (Ed = m, [ED &: (25.9) 


—©œ 


Dans ce qui suit nous allons étudier les processus aléatoires 
stationnaires œ ({) aux moyennes nulles. 

Par définition, la fonction de corrélation du processus aléatoire 
x (t) défini par l'expression (7) est 


Ra(h,t)=M{z (h)z(t)]= 


=M[{ k (E) @ (1 —E) dE j k (n) @ (és —n)dn |. (25.10) 


Les opérations de calcul de l’espérance mathématique et de l’inté- 
gration sont commutatives. L'expression (10) peut donc s'écrire 


Ra (ls #2) = ÿ k(E) j k (mn) M 19 (61 —E) @ (£a — n)] dn dE 


ou 


Re t:)= [ k (E) f k(n) Re(i—Ets—n)ändt. (25.11) 


—œ 


Puisque œ (£) et x (t) sont des processus aléatoires stationnaires, il 
vient 


Ro (ti —6, te —1n) = Ro (ts —t2 +n —E), 
Rats te) = Rs (ti—t), (25.12) 
et l'expression (11) devient 
Reu—t)= | k(G) | En) Ro(a—h+n—Bdndt (2513) 


ou 


no= | x@ [ xm8, (+n—E)dndt. (25.14) 


— © 


Dans ses travaux, A. Khintchine a montré que la densité spectrale 
S;(w) et la fonction de corrélation R/, (x) d’un processus aléatoire sta- 


21* 
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tionnaire f ({) sont liées par les relations 
20 | 
S;(w) — | Ri(r)e-iet dx, 
ee (25.15) 
Ri(9= + | S; (o) eist do. 


Conformément à (14) et (15), la densité spectrale du processus aléa- 
toire stationnaire x (f) cest 


Sxtu)= | &() À k(m | Ro(r+n—Et)e-ir dr an dE. (25.16) 


En introduisant une nouvelle variable 
v=tTtn—é, (25.17) 


on ramène l'expression (16) à la forme 


Sau)= | k(Eje-ividé | k(meinan | R(pe-iray 
on, en vertu de (3), 
SA (w) = D (iw) D (— iw) | Ro (y) e- iv dy. (25.18) 


On tire de (18) et (15) que les densités spectrales des processus aléa- 
toires stationnaires à la sortie et à l'entrée d’un système linéaire 
stable sont associées par la relation 


Sx(w) = | ® (io) F S, (o). (25.19) 


Comme x ({) est un processus aléatoire stationnaire à moyenne nulle, 
sa variance s'écrit 


M{z° (1)] = R, (0). (25.20) 
D'après (15) et (20), 
MI (= [ S, (w) de. (25.21) 
L'expression (19) permet de he (21) sous la forme 
2=M(# (= [ 1©) ES 9 (w) do. (25.22) 
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Pour un processus aléatoire’ stationnaire, & ({) (à moyenne nulle) 
du type bruit blanc, 


Re (x) = F8 (r), (25.23) 


où à (t) est la fonction impulsion de Dirac, et F, l’intensité du bruit. 
D'après (15), la densité spectrale de ce processus 


S-(w)=F | e-wtô (rt) dt — F = const, (25.24) 
ce qui peut être adopté comme définition du bruit blanc. La condition 
(24) traduit le fait que pour toute fréquence, la puissance des compo- 
santes partielles d’un processus aléatoire & (£) est la même. Le bruit 
blanc est donc le type le plus intense des perturbations. 


Si le signal d’entrée + (t) est un processus aléatoire stationnaire 
du type bruit blanc à densité spectrale 


Sy(w) =F, (25.25) 


en vertu de (22), la variance du processus aléatoire stationnaire 
z (t) à la sortie du système est 
= F ( | ® (io) F du. 
D'après (20) et (14) 7 
BR; (0)=F À k() | k(m6(m—E)dndi-F | (REF. 


Ainsi, la variance de x (t) à la sortie du système dans le cas où le 
signal d'entrée œ (£) est un bruit blanc, s'écrit 


B=F | LA (DIE dt = | | (iw) de. (25.26) 
En introduisant les notations 
| D (iw) | = À (w), (25.27) 
on a 
D (iw) = À (w) ei), (25.28) 


Ici À (w) est la réponse en amplitude et 1 (w), la réponse en phase 
du système. 
On tire de (26) et (28) que 


= | [4 (&)[° do. (25.29) 
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Si par A/ on désigne la variable 


oO 


_ | [A (w)]? do 
A = ——"— , 25.30 
j Aux SL 
l'expression (29) devient 
2 = FAhaxfe (25.31) 


La grandeur Af s'appelle bande passante du système. 

Cherchons maintenant la fonction de corrélation mutuelle et la 
densité spectrale mutuelle des processus aléatoires stationnaires 
z (t) et p (t), où  (t) est le signal d’entrée et zx (t) le signal de sortie 
d'un système linéaire. La fonction de transfert de ce dernier est 


® (D), où D = <. 


Par définition, la fonction de corrélation mutuelle s'écrit 
Re (li, te) = M [zx (t1) P (b:)1. (25.32) 


Puisque d’après (7) pour 4, —> —o, le signal de sortie x (£,) est 
de la forme | 


c()= À K(E)p(H—E) dE, (25.33) 


—o 
on a 


Reel 4) =M[ Î kBotu—5 40 (]= 


= | AE MipU—-H (IE | RCE) Roli—4—5)dE. (25.34) 


Ainsi, pour les processus aléatoires stationnaires: 
Rry (ts te) = R9 (E — te) = Ry (t), (25.35) 


T —= l = Lo (25.36) 
de plus, en vertu de (34), 


Rio(t)= | K(E) Ro(T—E) dE. (25.37) 
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D'une façon analogue 
Rox (1 te) = M (f1) x (t:)] = M [e (41) | k (E) P (2 — È) d | = 


— © 
œ 


_ | k (E) M{@ (41) @ (62 —E)] dE = 


= À HE) Rolh—t+E) dE. (25.38) 
Ainsi TT 
Roc (D = | K(E) Re (r+E) d8, (25.39) 


où, de même que précédemment (36), 
T —= b — la. 


D'après (15) on a la densité spectrale mutuelle S,, (w) 


Sao (@) = | Ro (TD) e- ist dr. (25.40) 
Conformément à (37), l'expression (40) devient 
Sa (0) = | k (E) | RQ(T—E) e-iut dt dE. (25.41) 
En introduisant une nouvelle variable 
vVv=T—É, (25.42) 
réduisons l'expression (41) à la forme 
Sxe (©) = | k(Ë)e- "6 dE | Ro(v)e-'ev dv. 
En vertu de (3) et de (15), cette expression peut s’écrire 
So (0) = D (io) S, (w). (25.43) 
D'une façon analogue: 
Sox (©) = | Rozx(T) ere dr = 


= | k(E) | Rolt+t)e-int dt dt. (25.44) 


— © —œ 
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En introduisant une nouvelle variable 
u=TtT+e£, (25.45) 
l'expression (44) se met sous la forme 


Sox (6) = | k (E) eivë dE | Ro (u) e-ivu du (25.46) 


ou, en vertu de (3) et de (15), sous la forme 
Sox (©) = ® (—iw) Sy, (w). (25.47) 


Etant donné que S, (w) = S,, (—w), les expressions (43) et (47) 
entraînent 


Sox (0) = S xp (— 0). (25.48) 
En retenant que 
Ro (o) — Ry (— 0), 
on trouve à partir de (37) que 


oO 


Ri(—9= À CE) Ro(r+E) dE, 


ce qui amène, d’après (39), à la relation 
Roz (T7) == Rio (—1). (25.49) 
Cherchons encore la fonction de corrélation mutuelle R,, (+) 
des processus aléatoires stationnaires x (4) et p (t) (à moyennes nulles), 


où z(t) est déterminé par l'expression (8). 
Par définition 


Rxo (1: te) = M {x (ti)p (42)] = M [ | k (E) (41 — E) dE p (#2) | = 


C0 oo 


= | AE)MIPU-E) (LI = À RE) Roo(h— HE) dE. (25.50) 


En introduisant comme précédemment (36) les notations 


T = tÀ) — bo, 


on a 


Ra (9)= | 4 (E) Ron (T—E) dE. (25.51) 
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La densité spectrale mutuelle S,, est 


S xp (©) = | Rob (T) er ot dt 


ou, d’après (51), 


Sao (0) = | k(E) | Roo(T—E)e-iur dx dE. (25.52) 


—œ 


En introduisant de même que précédemment (42) une nouvelle va- 
riable 

v=t—E, 
on obtient 


C0 


So (0) = | k(E)e- ii dE | Roplv)e-isv dv (25.53) 


ou 
S'xp (0) = D (io) Sp (@). (25.54) 
Si l’on tient compte que d’après (49) et (48) 
Rx (T) 7 R; (— 7), 
S px (wo) — ss, (—w), 
on a, en vertu de (51) et (54), 


CO 


Ron (= | CE) Ro (TE) dE, (25.55) 
Sox (0) == D (— io) Sy (0). (25.56) 


$ 26. Prédiction et filtrage des 
processus aléatoires unidimensionnels 


1. Méthode de A. Kolmogorov et N. Wiener. Processus aléatoires 
stationnaires. Considérons un système de commande linéaire mono- 
variable où on amène à l’entrée le signal 


p() =hk() + f(), (26.1) 


où h (ft) est le signal utile, et f (4), la perturbation. Admettons que 
h (t) et f (t) sont des processus aléatoires stationnaires à moyennes 
nulles. Le système a pour but de transformer (et en particulier, re- 
produire) avec la plus grande précision possible le signal utile (+). 

Désignons par Ÿ (D) la fonction de transfert du système et par 
k (t), sa fonction de poids. 
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D'après (25.7) le signal de sortie (sous l'hypothèse que l'instant 
initial {, —> —o) est de la forme 


z()= | QT (rar. (26.2) 


Supposons que le système a pour tâche de prédire le signal d'entrée 
utile. Pour réaliser la prédiction, imposons au signal de sortie x (1) 
d’être à l'instant t la meilleure approximation (au sens de minimisa- 
tion de la variance de l'erreur) par rapport à À ({ + 1), où n = const. 
Avec n > 0, on a un problème de prédiction. Avec 1 = 0, le pro- 
blème considéré est un problème de filtrage du signal d’entrée [20, 40]. 

L'erreur d'approximation du signal de sortie x (t) par rapport à 
h(t+n) est 


et) =h(G+n) —z() (26.3) 
ou, conformément à (2), 
e(t)=h(t+n)— | p(t— +) k(t) dr. (26.4) 


La variance de l'erreur d’'approximation s'écrit . 
M{e]=M {[a(t+n)— | pU—r)k(madr] }. (26.5) 


On se propose maintenant de chercher la fonction de poids # (+) 
qui minimise la fonctionnelle M {e*°]. Considérons cette fonction de 
poids comme optimale et le système auquel elle est associée comme 
système linéaire optimal. 

D'après (5), 


Me =M {h2(t+n)—2 (tn) | pU—T) (M ar+ 


00 


+[{ pu—nkma]) 


ou 


M{e]= M2 (+12 | KG) MUR (+ n) 2) dA + 


+{ k (À) | k()Mip(t—2)p(t—#8)]d0 dx. (26.6) 
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Les processus aléatoires k (t) et o (£) étant des processus stationnaires 
à moyennes nulles, l'expression (6) devient 


M{e*]= R:(0)—2 | (A) Ra (a+ n) dà+ 


Fe | k (à) | k(0) R(À—8)d8 du. (26.7) 
Les fonctions de corrélation À, (4), À, (t) et R}, (t) sont supposées 
connues. 


Cherchons à présent la condition nécessaire pour que la fonction 
k (t) minimise la fonctionnelle 


I=M le]. (26.8) 


A cet effet, remplaçons k ({) par la fonction k (£) + yx (t), où y 
est un paramètre arbitraire ne dépendant pas de £ et x ({), une fonction 
arbitraire qui, d’une façon analogue à la fonction k (t), vérifie la 
contrainte 

x (—t) = 0. 


Introduisons la notation 7 + ÔZ pour la valeur que prend la fonc- 
tionnelle 7 lorsqu'on remplace # (t) par la fonction k (t) + yx (+). 
En vertu de (7),on a 


LH61= R(0)—2 | LE (A) + vx (1 Rio (A + n) dh+ 


+ D RQ)+me QD | 1E(6)+ vx (8) Ro (A —8)28 2h. (26.9) 


Le dernier terme de l'expression (9) peut s'écrire 


Q=— [ k (À) f k (8) Ro (A — 8) dd dA + 


na | | % (À) | k (9) Ro (À — 8) dd dA + 


+ | k() | x (8) Ra (À — 8) 8 dà + 
+ [ 40) | x(8) R(A—8)d8 2. (26.10) 
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Les deuxième et troisième termes de l'expression (10) coïncident en 
raison de la parité de la fonction À, (t). 
Désignons par 7, le facteur affecté à +* du dernier terme de (10) 


L= | x (À) | x (0) Ro (À — 8) dd dA. (26.11) 


D'une façon analogue au dernier terme de (7), l'expression (11) peut 
s'écrire 


1: = M { | | p(i—Tt)x(t) dx|"}. (26.12) 
Il est évident que 
Ta > 0. (26.13) 
Ainsi, l'expression (9) se ramène à la forme 
I + ôI = I — 2yI, + y*L;, (26.14) 
où 
= | Ro@+mx(ydr— [x(4) ÜE(8) Ro (6) d8 a (26.15) 


En tenant compte du fait que 
k(—1 =0, x (—t) = 0, (26.16) 
on peut récrire l'expression (15) 


= | x (A) [Rue (A+ n) — Î k(S) Rg(À—8)d8 |A. (26.17) 
0 0 


La condition nécessaire pour minimiser la fonctionnelle (7) est 


Ô . 
[& +81)] _.=0 pour tout x(À). (26.18) 
D'après (14), la condition (18) devient 
1 = 0: (26.19) 


On voit sans peine que la condition (19) est non seulement néces- 
saire, mais encore suffisante pour minimiser la fonctionnelle 7. A cet 
effet il faut montrer que quel que soit le choix de la fonction x (4), 
on a l'inégalité 

(TL + ÔT)r1,-0 > J. 
L'expression (14) entraîne 


(L+ ôl)r5=0 = 1 +2 >T, 
du fait que d’après (12), 7, > 0. 
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Ainsi, nous avons démontré que la condition (19) est nécessaire et 
suffisante pour minimiser la variance M [e). 

La condition (19) devant être vérifiée pour toute fonction % (À), 
conformément à (17) la condition de minimiser la variance M |e*] 
devient 


Rae (A+ — | Ro(k—D)k(0)d8—0 (420). (26.20) 
0 


De la sorte la fonction de poids k ({) vérifiant l’équation intégrale 
(20) assure la valeur la plus petite possible de la variance de l'erreur 
M [e°|]. 

L’équation intégrale (20) a été obtenue par N. Wiener [20]. 
Pour accorder nos raisonnements avec les notations de Wiener, rem- 
plaçons dans (20) la variable d'intégration 8 par À, la variable des 
fonctions de corrélation R,, et R,, qui dans (20) se note À, par T. 
L'équation (20) devient alors 


Rro(t+n)— | Relr—A)E (A =O  (1>0) (26.21) 
0 
Dans le problème de filtrage, c'est-à-dire avec 


n = 0, (26.22 


en vertu de (21) la fonction de poids optimale # (4) doit satisfaire à 
l'équation intégrale 


Rup(r)— | Rot—à)(G)dA=0  (r>0) (26.23) 
Û 


2. Résolution de l'équation intégrale définissant la fonction de 
poids d'un système optimal. Désignons par S, (w) la densité spectrale 
du signal d'entrée o ({). Puisque S, (w) est une fonction positive 
paire de «w: 

Sy (0) = Sy (—o) > 0, (26.24) 


on peut la mettre sous la forme d’un produit de deux fonctions com- 
plexes conjuguées 


So (o) = (io) Y (iw) = | Ÿ (iw) f?, (26.25) 


où la fonction W (p) formée à partir de W (iw) en remplaçant la va- 
riable iw par p jouit de la propriété telle que tous ses zéros et tous ses 
pôles se situent à gauche de l'axe imaginaire dans le plan de la variable 
complexe p. La transformation (25) s'appelle factorisation de la 
fonction S, (w). Dans le cas où S, (w) est une fonction rationnelle 


de w, la réalisation de la transformation (25) ne présente aucune 
difficulté. 
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Vu les propriétés indiquées de la fonction Y (p) le système à 


e 4 = d 
fonction de transfert FO) où D — nr est stable. 


Imaginons que le système optimal cherché est composé de deux. 
DE linéaires reliés en série aux fonctions de transfert respectives. 
YO) et L @) [76]. 

La densité spectrale du signal © (£) à la sortie du système à fonc- 
tion de transfert 1/Y (D) est, d’après (25.19) et (25), 


1 
[YF (io) [° 


c'est-à-dire que le signal 0o (t) est un bruit blanc (processus aléatoire 
stationnaire) à densité spectrale unitaire. La fonction de corrélation 


Se(w)= So(v)=1, (25.26) 


de o (t) est, d’après (25.23) et (26), 
Ra (tr) = 6 (1), (26.27) 


où 6 (rt) est la fonction impulsion de Dirac. 
Désignons par L (t) la fonction de poids du système de la figure 26.1 
à fonction de transfert ZL (D). En vertu de (25.1), on a 


pL (p) + 1 (à. (26.28) 


Il s'ensuit du schéma de la figure 26.1 que la fonction de transfert 
ŸY (D) du système optimal recherché s'écrit 
Ld 4 
} D)=-ÿ75 LP). (26.29) 
Pour que Ÿ (D) soit la fonction de transfert d'un système assurant 
la transformation optimale du signal q (t), il faut que la transforma- 
tion du signal © (t) par le système à fonction de transfert L (D) soit 
optimale. À cet effet, la fonction L (?) doit vérifier l'équation intégrale 
qui, en vertu de (23), s'écrit 
Rio (T) = | Rott—A)l(A)di  (1>0). (26.30) 
0 
Puisque d’après (27) 


Raft—-h =8ô(tT—- D, 
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l'équation (30) devient 


Rio(9= | 1(H6(E—A A, (120), 
0 
d'où il résulte 


Lt) = Ro (). (26.31) 
D'après (25.15), 
Rio (t)= | Sno (w) eist do. (26.32) 


D’après (25.56) et compte tenu de fait que © (?) est la sortie et  ({), 
l'entrée du système à fonction de transfert —— TT FD la densité spectrale 
Sa (w) peut être mise sous la forme 


Sno (0) = pr She (0). (26.33) 
(31), (32) et (33) impliquent que 
LD= 2 Î PT eur du. (26.34) 
En vertu de (28) 
L(p)= | L(t)e-”" dr, (26.35) 


d’où, conformément à (34), on a 


1 C  Shç() 
Lip=s [era | FD 
0 


eiut dw. (26.36) 


La fonction de transfert Ÿ (D) {| où D — 5) du système optimal 
cherché est déterminée, d’après (29) et (36), par l'expression 


1 À C She (v) 
Y (p) Tv (p) e—Pt dt Fra) € dw. (26.37) 


Dans le cas où les densités spectraies S, (w) et S,, (w) sont des 
fonctions rationnelles de w, la fonction de transfert Y (D) se calcule 
sans peine. Dans ce cas, d’ après (25), 


Se (o) = Ÿ (io) F (—io); 
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de plus, comme nous l'avons déjà dit, {ous les zéros et tous les pôles de 
la fonction Y (p) reposent à gauche de l'axe imaginaire dans le plan 
de la variable complexe p. 

Introduisons maintenant les notations 


Shy (@) 
Y(—ivw) 
et examinons la fonction À (p) qui se forme à partir de XÆ (io) en 
remplaçant la variable iw par p. Comme Æ (p) est une fonction ra- 


tionnelle de p, on peut la développer en une somme de fractions 
élémentaires et la mettre sous la forme 


K' (p) = Æ*(p) + KT (p). (26.39) 
où tous les pôles de la fonction X* (p) se situent dans le demi-plan 


gauche de la variable complexe p, et tous les pôles de la fonction 
K- (p) se trouvent dans le demi-plan droit de p. L'intégrale 


K (iw) — (26.38) 


est égale à la somme des résidus de la fonction À (it) est par rapport 
à tous les points singuliers de la fonction À (if) situés dans le demi- 
plan supérieur de la variable complexe &, c'est-à-dire représente 
l'original F (t) dont la transformée est la fonction A+ (it). 

Etant donné que Æ * (ië) est la transformée de la fonction F'(t),ona 


(r (the-iot dr — K* (iw) ; (26.40) 
Ù 
l'expression (37) devient donc 
Ÿ (iw) = Fe , (26.41) 
il en résulte que 
Y'(p)= + _ : (26.42) 


L'expression (42) définit la fonction de transfert d’un système 
optimal dans.le cas où les densités spectrales S, (w) et S,, (w) sont 
des fonctions rationnelles de «w. 

3. Processus aléatoires non stationnaires. Equation intégrale de 
la fonction de poids optimale. Supposons qu'à l’entrée d’un système 
linéaire non stationnaire monovariable soit appliqué un processus 
aléatoire non stationnaire & (t). Désignons par à ({, t) la fonction de 
poids de ce système. Le signal de sortie du système qui à l'instant 
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1 — t, était en équilibre (E (4) —0) sera 


t 


E (4) — | d (4, T)é(t)dr. (26.43) 


lo 


Par pL (?) on désigne la sortie désirée. Si par exemple, & ({) = m (t) + 
+ n (4), où m (ft) est le signal utile et » (1) les perturbations, la sortie 
désirée peut ètre de la forme pu (t) = m (t) ou présenter une trans- 
formation donnée du signal utile m (t). 


Introduisons la notation e ({) pour l'erreur de reproduction du 
signal désiré 


e(t) = (it) — E (0) (26.44) 
ou, conformément à (43), 
e(t)=u (t) — | ®(t, T)ü(r)dr. (26.45) 
lo 


On a pour la moyenne de e* (£): 


I ()=Miet (= M { [u (t) — | (4, T)E(r) ac|'} (26.46) 


0 
ou 


t 
1O=MIR(1—2M Tu [06 5)Ema]+ 
to 


+ M [ Ÿ (4, T)Ë(T) a | Ÿ (4, o)C (0) do | . (26.47) 


En admettant que u (1) et & (t) sont des processus aléatoires à moyen- 
nes nulles et en désignant par 


Pau (T: 0) = Mu (rt) u (0)], 
Pur (T, 0) = Mu (t)G(o)], | 
Per (T, 0) = MIE (Tr) 6 (o)] 


les fonctions de corrélation définies sur l’ensemble des fonctions aléa- 
toires respectives, l'expression (47) devient 


(26.48) 


LE) = Pau (Es 9) — 2 À 8 (6, +) que (é, 7) dr + 
to 


t { 
+ 9 (1, T) | O(t, o)qu(r, c)dodt. (26.49) 
to to 


22—0393 
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La grandeur J (f) qui est la variance de l'erreur dépend de la 
forme de la fonction de poids, c’est-à-dire représente une fonctionnelle 
définie sur la classe des fonctions de poids des systèmes linéaires non 
stationnaires. Si Ÿ ({, t) est la fonction de poids optimale, c'est-à- 
dire si elle minimise la fonctionnelle Z (ft), cela signifie que pour toute 
autre fonction de poids Ÿ (£, t) + yh (t, t) (où y est un paramètre 
arbitraire indépendant de £ et de ©), la variance de l’erreur est 
I(D +61 (t)>T(t). En vertu de (49), 


| 4 
L (ED BI (8) = Pau (és 2) — 2 | 8 (8, 7) qui (E, 7) dr — 
lo 
| 4 
— 2 [ED que à + 
to 


l t 
+- | [Ÿ (é, T)+yh (£, T)] | [Ô (é, o)+yh (4, O)] Prc (x, 6) do dt. (26.50) 
lo 


lo 
Le dernier terme du second membre de (50) s'écrit 


t 


t 
e0=] D(6 7) | 8 (4, o)qu(r, o) do dr + 


ty 


+7 


L 


{ { 
h(t,%) | © (4, o)Pex (T, 6) do dt + 
0 î 
t À 
+y fo [A o)œxtr, o) do dr+ 
0 to 


t t 
+ 45 | h(t,T) | ht, o)q:(r, o)do dr. (26.51) 
to to 
Comme 

Per (T, ©) = qu (0, t), 


l’avant-dernier terme du second membre de (51) devient 


{ t 
y [oc À h(e o) quctr, o) do dr 
lo 


ln 


t t 
= | h(£, 0) | D(f,.t)::(0, t)dtr do. (26.52) 
to to 
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Introduisons maintenant les notations 


t { { 
AO | h(1, o)qur(#, 0) ao— | h(£, 0) | ® (1, T) x (0, t) dr do 
ot 


t t 
I1(t) = \ h (8, 0) [que (e, 1 DT) fo, t)dr]do. (26.53) 
Désignons . TI, (t) : RENE 


L (t) = ( h(t,%) | h(t, o)Qu(r, o)do dr. (26.54) 


L'expression (54) peut s’écrire 


t 
LO=M[T 2e Html), 
lo 
d’où il résulte que 
I, () > 0. 
L'expression (50) devient donc 
I (4) + ôT (t) = TI (4) — 2y1, (t) + y*2: (0). (26.55) 


La condition nécessaire pour minimiser la fonctionnelle (46) a pour 
expression : 


FU (+81 (£)]y=o =0 pour tout À(f, t). (26.56) 
D'après (55), la condition (56) devient 
I, (t) = 0. (26.57) 


La condition (57) est non seulement nécessaire pour minimiser la 
fonctionnelle (46), elle est encore suffisante. En effet, pour Z, (t) = 0, 
l'expression (55) s'écrit 

[I (6) + ÊT (rico = 1 (2) +%° 2 (6) > T(E), 


du fait que 7, (t) > 0 pour tout h (f, T). 

Comme la condition (57) doit être respectée quelles que soient 
les fonctions À ({, t) d’après (53) la condition de minimisation de 
M {e* (1)] est 

{ 
| D (4, Too, T)dt=que(é 0),  Eo<Lt. (26.58) 
to 
De la sorte, la fonction de poids optimale Ÿ (£, t) doit vérifier l’e- 
quation intégrale (58). Cette dernière s'appelle équation de Wiener. 


22° 
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Cherchons maiutenant la variance de l'erreur d’un système opti- 
mal. D'après (49) 


M Le* (#)1= Pau (b 2) — | © (4, 7) que (é, D) dr — 


E | LA [que (£, 3 © (4, 0) que (r, 0) do | dt. (26.59) 


Etant donné que la fonction de poids optimale satisfait à la relation 
(58), pour un système optimal l'expression (59) devient 


t 
M [e° (t)] = Quu (6, ) — | 8 (4, T) Pac (f, t) dr. (26.60) 
to 


Voici encore la déduction de deux relations qui, dans le problème 
exploré, constituent le contenu du lemme sur la projection orthogo- 
nale dans un espace de Hilbert, de grand intérêt pour la théorie du 
filtrage linéaire ([25], p. 286). 

L'équation (58) peut s'écrire 

t 
MiH(6 (= | BE TMIE(o)E (HI,  LEo<t, 
to 
ou 


{ 
Mi G)EGN= MIT 06 HDEtart()], n<o<t. 
to 
En vertu de (43) cette expression se met sous la forme 
MIu(t)6(o)]=MIE(4)C (0), <o<t, 
ou 
M{{u()—5()16(0)}=0,  to<o <t. 
Puisque d'après (44) e (t) = u (t) — E (t), on obtient 
Peg (ft, O)=0, LEO Lt. (26.61) 


Considérons maintenant l'expression (43). En multipliant par 
e (t) les deux membres de (43), on a 


t 
e(E()= | 8, ce (8) (0) do. 
to 
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Si l’on remplace les deux membres par leurs espérances mathé- 


matiques, il vient 
! 


Mle(DE(D1= À 0 (4, 6) Mie (#5 (o)1 do. 
to 
D'après (61), le second membre de cette expression s’annule, et 


donc, 
Peg (4, 4) = 0. (26.62) 


4. Filtres optimaux de Kalman-Bucy. Etudions le système décrit 
par l'équation différentielle scalaire 


7 = () x +w (6). (26.63) 


La présence des dans les organes de mesure fait que 
l'état du système se définit avec une erreur de façon ul les résultats 
de l'observation soient de la forme 


z(D =z(t) +ov(). (26.64) 
Supposons que w (1) et v(t) sont des bruits blancs gaussiens non sta- 


tionnaires à moyennes nulles. Les fonctions de corrélation de ces 
processus. sont 


Pouw (, T)=M{w(t)w(t)]=g(t) Ê(t—7+), 
Poo (LT) = M [v (&)v (r)] =r(t)Ê(t— 7), (26.65) 
Po (6, T) = M [w (#) v (t)] = 0, 


où qg{t)et r(t) sont des fonctions continues dérivables; en outre, 
q (t) est une fonction non négative et r ({), une fonction positive pour 
iouite valeur de £. Par à (t) on désigne la fonction impulsion de Dirac. 
Le vecteur z ({,) est une variable aléatoire gaussienne indépendan- 
te de w(t)et v(t), à moyenne nulle M {zx ({)] = 0 et à variance 
connue. 
Pour définir l'estimation zx (t) de l'état x (t) du système (63), 
Kalman et Bucy [37] ont proposé d'utiliser un filtre qui est un système 
régi par l'équation différentielle linéaire inhomogène 


 =s(hr+k(t)z(t),  Tz(to)=M{z(to)]=0. (26.66) 


Par ailleurs, les fonctions s (t) et k (t) de l'équation différentielle 
(66) doivent être choisies de façon à vérifier la condition 
M {{x (4) — x ()F} = min. (26.67) 
Désignons par 4 (4, t) la fonction de poids du système gouverné 
par l'équation différentielle homogène 


_ = s()Z. (26.68) 
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La solution de l'équation différentielle (66) s'écrit alors 


{ 
2 (0) = (#4, to) Z (to) + | pt, T)k(T)z(r) dr. (26.69) 
to 


Introduisons les notations 


at, T)=#vt(t, T)k (Tr). (26.70) 
(70) entraîne que a (£, t) =wb(t, t)k(t), et comme 
ps, 1) = 1, 
il vient 
at, t) = k (t). (26.71) 


Conformément à (69) et (70), pour zx (t,) = 0, la sortie du système 
(66) est de la forme 


{ 
2(t)— | a(t,t)z(t)dr. (26.72) 
to 
Dans le problème de Wiener, l'expression (43) correspond à 


l'expression (72). Le signal de sortie désirable est la fonction x (4). 
C’est pourquoi l'équation intégrale de Wiener (58) devient ici 


t 
| aft,t)p,(0, TDdt=p,(t, 0), bEo<t. (26.73) 
to 
Comme il résulte de la solution du problème de Wiener, la fonc- 
tion a (f, +) qui vérifie l'équation intégrale (73), minimise la fonc- 
tionnelle (67). 
En dérivant par rapport à £ les deux membres de (73), on obtient 


{ 
fa 7) qu: (os 7) dr + a (4, 1) Qu (0, = Paré, 0), O0 Lt 
to 


(26.74) 


Les processus aléatoires x (t) et v (t) n'étant pas corrélés et v (o) 
et v(t) ne l’étant pas pour toute valeur de o < #, l'expression 


Pzz (0, #1) = M {x (0) +v(o)liz (ts) + v(91} (26.75) 
peut s’écrire 
Pzz (Os À) = Pr (o, à) = P:x (o, t), 19 Lo Lt. (26.76) 


Constatons que puisque œ. ({, ©) = p.+ (06, t), (76) implique la 
relation 
Pr (0, À) = Paz 0) bb L<O<t. (26.77) 
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Considérons maintenant le second membre de l'expression (74). 
(63) conduit à 


_. Prz (4, 0) = _. M{z(t)z(0)]=M [x (1) z (o)] = 
=M{f(t)z(t)z(o)]+Mw(t)z(o)]. (26.78) 


Comme il ressort des équations (63) et (64), le processus aléatoire 

z (6) n’est corrélé pour aucune valeur de © << t avec le signal d'entrée 
postérieur w (ft), soit 

M [w (4) z (o)] = 0, bb LOL, (26.79) 


et (78) devient 
7 Pas (,0)=f(t) Ps: 0) Ko <t. (26.80) 


Ainsi, conformément à (76), (77) et (80), l'équation (74) se met sous 
la forme 


[2 — a(t,Tt)9.(0, t)dr+a(i,t)p.(t, o) = f(E) ps: (6, 0), 


d 


LOL. (26.81) 
En remplaçant ., ({, 0) par l'expression (73), on ramène l’expres- 
sion (81) à la forme 
t 
| Hat, D po, r) dr+ 
to 
t 
Hça(t, t)—f()] | alt, t)p.:(o,T)dr=0, HbEo<t, (26.82) 


to 
ou 


[rate T)—a (té, t)a(t, Di — a (1, r) | D: (o, t) dx=0 


(LOL. (26.83) 
Introduisons la notation 


b(t,t)=f(t)a(t, T)—a(t,tha(t, + rat, T). (26.84) 


‘équation (83) peut s'écrire alors 
Î 
| b(t, T)9.: (0, t)dt=0, LEO Lt. (26.85) 


to 
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En additionnant les premiers et les seconds membres des équations 
(73) et (85), on obtient 


Flat, D+b( Dig (o, Ddr=qu(t 0)  tEo<t (26.86) 


to 


Ainsi la fonction at, t) + b(t, t), de même que la fonction 
a (t, +) sont des solutions de l’équation intégrale (73) qui minimise 
la fonctionnelle (67). 

Il est facile de montrer que puisque la fonction r (ét) de l’expres- 
sion (65) est supposée positive pour tout £, la différence de deux 
solutions de (73) est nulle 


(at, T)+b(t, t)]— at, +) = 0, PE A À 


Pour le démontrer, considérons la relation (61). Dans le problème 
que nous étudions cette relation devient 


M {e (4) z (o)] = 0, tb LOL, (26.87) 
ou 
Pez (£, O) — 0, lo < CO < L{. (26.88) 


D'après (72), l'estimation optimale qui correspond à la fonction 
a (f, T) est 
t 


Z (t) = | a(t,T)z(x) dr. (26.89) 


lo 
L'estimation optimale associée à la fonction at, t) + b (ft, t) 
s'écrit 
{ 


z (t)= | [a(£, T)+b (6, t)]2 (t) dr. (26.90) 
to 
En désignant par 
x(t)=2z(t)—z(t), (26.91) 
on a 
t 
x (4) = | b(t,T)z(r)dr. (26.92) 


to 


La condition (87) entraîne les relations 
M {{z( —z(t]z(o)}—=0, M {{x (9 — zx (#]z(o)} = 0, 
d’où il s'ensuit que 
M [x (1) z (o)] = 0. (26.93) 
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Considérons maintenant les relations (89) et (90) dont il résulte 
que 
t 
M [x (1) 7 (0)] = | alt, s)M{x(t)z(o)] do, 
to 
Li 


Mb()2(1= | ta(, o)+ 0 (1, 5)1M 1x (8) z (o)] do. 


Puisque d’après (93) les seconds membres de ces relations sont nuls, 
il vient 


Mix()z()]1=0, Mlx(s) x (t] = 0. 
On en déduit que 
M {x (D1z(D—z(9]} =Mlx(t)x(91—0. (26.94) 
En portant dans (94) la valeur (92) de la fonction x ({), on obtient 


{ 1 
| b(t,T) | b(t,a)MI[{z(r)z(o)] do dr = 0. (26.95) 
Comme È ' 
M {2 (7) z (0) = Mfx (7) x (o)] + M v (x) v (o)] = 
= Ml (x) x (o)] + r (x) ô (rt — 0), 


l'expression (95) devient 


t t 
Î b(#, 5) | b(t, o){M{z(t)z(o)]+r(r)ô(t—0o)} do dr =0 


ou 
t 


| LE (4, t)r(t)dt+ M2 (0]=0, (26.96) 
to 


avec 
t 


2. (1) = | b(t, t)x(r) dr. 
to 
Etant donné que r (rt) > 0, M [4° (t)] > 0, la relation (96) conduit à 
bft, t=0, 4 <T<t. (26.97) 
Les relations (97) et (84) permettent d'obtenir 


_ a(t,T)=f(tha(t,T)—a(t,t)a(t, 1). (26.98) 
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En dérivant par rapport à { les deux membres de l'expression (72), ona 


. t 
= | La (e, t)z(t)dt+a(t,t)z(t). (26.99) 


lo 


On déduit de (99) et (98) que 


... À 
= | (fat, t)—a(t,tjaft,r)]z(t)dr+a(t,t)z(t) (26.100) 
to 


ou 
LA [A 


dE _$() | a(t,t)z(t)dt—a(t,t) | a(t,t)z(t)dt+a(s, t)z(e). 


4o to 
(26.101) 
Conformément à (72) et (71), l'équation (101) devient 
dx à 
= ()—k (1244 (4) z (0). (26.102) 


Les équations (102) et (66) impliquent que la fonction s (t) interve- 
nant dans l'équation (66) s'écrit 


s(t) = f(t) —k (+). (26.103) 
Ainsi le filtre optimal dont l'équation (102) peut s'écrire 


Ce f()z+k(t)[z(4) — 2x], (26.104) 


est un système à retour dans lequel l'écart entre avec un gain # (!). 
I1 reste encore à définir la forme de la fonction 4 (t). En portant 
dans l'équation (102) l'expression (64) de z ({), on obtient 


= f (THE (8) (x —2) + K (0 v (6). (26.105) 
Désignons par e (t) l'erreur d'estimation de l’état du système 
e(t) =zx(t) — zx (+). (26.106) 


Les équations (63) et (105) permettent de trouver l'équation diffé- 
rentielle vérifiée par e (t) 


D [f (6) —E (6)1e + av (2) —K (+) v (0). (26.107) 


En vertu de (68), (69) et (103), la fonction de poids de l'équation 
différentielle homogène 


D =) —k (je 
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est Ÿ ({, t). La solution de l'équation (107) s'écrit 
t 
e(t)=%({, to) € (to) + | dé, T){w(t)—£k(T)v(r)] dr. (26.108) 
to 


Cherchons maintenant l'équation différentielle vérifiée par la 
variance de l’erreur 


L( =M fe (2)]. (26.109) 
Comme 

de? de 

a = 2€ 


d’après (107), on a 
Jet = 2{[f()—k(t]e()+2w(the(t)—2k(t)v(the(t). (26.110) 


En remplaçant le premier et le second membre de l'équation (110) 
par leurs espérances mathématiques, on obtient l'équation diffé- 
rentielle par rapport à L (t) 


= 2 1f (6) —k (6)1 2 + 2M [ (#) e (2)1 — 2k () M [o (e) € ()]. (26.111) 


Pour calculer M{w(t)e(t)], considérons l'expression (108). En 
multipliant ses deux membres par w (t) et en passant aux espérances 
mathématiques, on obtient 


M [w (e) e (1)] = (€, to) M [uw (t) e (to)] + 


! 
+ [ht DM Ov (HI—E(TMIw()o(l}ér. (26.112) 

to 
D'après (65), M iw (t) & (t)] = 0. Etant donné que l'erreur initiale 
eft) =z(t) —zt(t) n'est pas corrélée avec w(t), il vient: 
M [w (t) e (t0)] = 0. Donc, l'expression (112) se met sous la forme 


{ 
Miw(e(i= | +, 7) Mlw()w(r)lér 
to 
ou, d’après (65), 
t 
Miw(e(]= | DA Ta()6(—T) db (= 700. 


(26.113) 
D'une façon analogue, on a 


M{v(De(91= —+k (tr (0). (26.114) 
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En vertu de (113) et (114), l'équation différentielle (111) devient 
dl a 
D =2((D—E (DL a () + (Dr (D. (26.115) 
Dans ce qui suit nous aurons besoin des formules (61) et (62) 
du point précédent. Dans notre cas celles s’écrivent 
Pez (4, 0) =0, bo <o<t, (26.116) 
Pes (£, t) = 0. (26.117) 


En tenant compte des formules (106) et (64), on a pour la relation 
(116) 


M {{z (é) — x ()] [x (o) + v (0o)1} = 0. (26.118) 
Il s'ensuit de (63) et (64) que 
M [zx (4) v (o)] = 0. (26.119) 


En substituant (72) à x (t), on obtient 
t 
M{z(t)z(o)] — | a(t,t)M{{r(t)+v(r)] [x (o) +v(o)]} dr =0 
to 
ou, en vertu de (119), 
t 
M{z(t)z(o)] — | a(t,t){M{z(t)z(o)] +Mlv(t)v(o)]} dr = 0. 
lo 
D'où, en tenant compte du fait que M [v (x) v (o)] = r (x) 8 (T — 0), 
on a 
t ! 
Pax(e, 0)— (af, mo(r, c)dr= À a(e, r)r(r)8(r—0) dr, 
to lo 
Lo LOL, 
ou 
t 
Paz (4, 0)— [ aft,r)quu(r, o)dr=a(t,o)r(o), H&o<t. (26.120) 
to 
Le premier et le second membre de la relation (120) sont des fonctions 
continues de © pour tout f fixé. C’est pourquoi en passant dans (120) 
à la limite pour © —+ t et en retenant que a (?, t) = k (t), on obtient 
t 
Prx (4, à) — | at, Tp.s(tt)dt=k(t)r(. (26.121) 
lo 
Puisque d’après (76) 
Pxx (r, t) — Pzx (Tr, t), 
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l'expression (121) peut être récrite 


M{z(z(t)]—M [| a(t,t)z(v) dr z (t) | —k() r (t) 


ou, conformément à (72), 


Miz()z(d]l—Miz(tz(tl =M {{z( —z(blz(t)} = 
= k(t)r (d. 
Cette dernière expression peut s'écrire 
M {e(t)le(t) + z(1]} = k(d r (0. (26.122) 
Comme d'après (117) M [e (t) x (t)] = 0, on déduit de (122) et (109) 
que 
L(D =k(Dr(b. (26.123) 
I1 ressort de (123) que 
(=. (26.124) 


Les expressions (115) ‘et (124) donnent la forme définitive de l'é- 
quation différentielle vérifiée par la fonction / (t) 


= P + (0. (26.125) 


L'équation différentielle (125) est une équation de Riccati. Pour 
la résoudre, il faut donner la valeur initiale Z (£,). Supposons d’après 
(66) que 


z (to) = 0. (26.126) 


Puisque d’après (106) e (to) = x (to) — x (to), conformément à (109) 
et (126) la valeur initiale Z (4) — M [e? (t,)] devient 


| (to) = M [x (to) z (to)], 
soit 


L(lo) = Pxx (los to). (26.127) 


5. Systèmes stationnaires à temps infini d'observation. Exami- 
nons le système décrit par les équations différentielles 


= fz+w (+), 

z(t)=z(t)+ov(t), (26.128) 
qui s’obtiennent des équations (63) et (64) pour 

f (à) = f = const. 
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Supposons que les processus aléatoires w (t) et v (t) soient à moyennes 
nulles et aient comme fonctions de corrélation 


M [uw (6) w (x)] = qô (t — 7), 
M [v (8) v (t)] = rô (t — r), (26.129) 
M {w (t)u (x) = 0, 


où q et r sont des constantes positives. 
D'après (125), l’équation différentielle de Riccati, vérifiée par 
la variance de l’erreur du filtre optimal Z (t), s'écrit 


dl 1 
L'équation différentielle (102) du filtre optimal devient 


D f—R (12 +K (020, (26.131) 
où, en vertu de (124), 
k (= 21 (0). (26.132) 


Etudions d’abord le cas où l'instant initial de l’intervalle d’ob- 
servation /{, — —o et, par conséquent, l'intervalle d’observation 
t — t, vérifie la condition lim (£ — {,) — . Dans ce cas, comme 


to—»— 00 
nous allons le montrer dans ce qui suit (155), la solution de l’équation 
de Riccati (130) a pour {, — —o la limite 


lim (=, (26.133) 


to—>— co 


La 


qui existe pour tout {; de plus, Z est une constante positive, solution 
de l'équation algébrique 


2fi—LÈ+g—0. (26.134) 
La solution positive de l'équation (134) s'écrit 
Î=(f+myr, (26.135) 
ou 
m= y f+2>0. (26.136) 


En outre, d’après (132), 


k(=+ ik, (26.137) 
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où | 
k = f + m. (26.138) 
L'équation du filtre optimal (131) pour le cas où {, — —o devient 
di A 


Le filtre optimal est asymtotiquement stable du fait que m > O. 

Considérons maintenant le cas où {>> — et cherchons la 
solution de l'équation différentielle de Riccati (130). A titre d’exem- 
ple de la théorie générale énoncée ci-dessous (28.85), montrons que la 
fonction / ({), qui est solution de (130), peut être exprimée à l’aide 
de la matrice fondamentale des solutions du système d’équations 
différentielles linéaires 


De — fut Le, 

îl = qi + fnz. (26.140) 
On voit aisément que (140) entraîne 

ne (4) = 2 (4) m (0, (26.141) 


où L (t) est solution de l’équation de Riccati (130). En effet, confor- 
mément à (141), la deuxième équation (140) se met sous la forme 


D DHL = gn (D + (Om. (26.142) 


En portant dans l'équation (142) au lieu de 2 le second membre de 


la première équation (140) et en tenant compte de (141), on obtient 
la relation 


(24 Pa) nt 0. (26.143) 


Cette égalité est vérifiée identiquement en vertu de l'équation de 
Riccati (130) qui définit la fonction Z (1). Nous avons justifié ainsi 
la relation (141). 

Désignons par £g (t) la matrice fondamentale des solutions du sys- 
tème d’équation (140), et par IT ({, f,) la matrice 


IT (£, to) = & (1) 87° (to)- (26.144) 
La solution du système d'équation (140) s'écrit 
| n (@) = IT (#4 to) n (to); (26.145) 


ou 


[ui(i, to)  [ie(é, to) Mi (4) 
IT (é, Lo) — es (t, to) Na (4, to) ; n (4) == É "À à (26.146) 
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(145) implique 


n (4) = I] (é, Lo) n (Lo) + IL, ; (4, Lo) LE (0) ” 
ne (4) = I, (4, te) ", (Lo) + Ia (£, Lo) N2 (to)- 20948) 


Puisque d’après (141) 

Ne (Lo) = À (£o) Ni (Lo) (26.148) 
(147) et (141) entraînent 
L (1) M; (£, Lo) + [is (8, to) À (£o)] = 

= [a (6, Lo) + [ss (6, to) (to); (26.149) 


et, par suite, 


 Hos (ts to) + os (4, to) L (tn) 
NE His (ts to) Mie (4, to) L'(to) © (26,150) 
La matrice fondamentale des solutions du système d'équations (140) 
s'écrit 
(m—fjent  —(m+fe-nt | 
g (t) — | ge! ge"! | | (26.151) 


J1 en résulte que 


Le-mo MET ,-mto 
_{ - 2m 2qm 
g”* (to) — , : + (26.152) 


L 2m 2qm 
Conformément à (144), (151) et (152), 


Ii: (6, do) = MEL emt= to) + EL e-mtt-t0), 


m°—f° m°?— 2 
IT (£, Lo) = TT em(i=—to) — M em te) | 


(26.153) 


Tes (4, to) = mt to) — LE gmit to), 
[se (t, do) = MEL ete) a TI e-m(t-to), 
11 s'ensuit de (150) et (153) que 


l 
LO= En s 


me 
ñn. (t) = 5 emtt-to) _ 5 ermtt-t0) + [ aus ent to) L 


+ Le-ntt-t0] L (Eos 


m — f 
2m 


ent to) ML mt to) + 


ne (1) = Im 


m2— f2 . ma—fs 4, 
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En tenant compte que d’après (136) m?—f*=—qg/r, la relation 
précédente se met sous la forme 


ni () 
=D, (26.154) 
nf (£) = gen to) — ge-mt-to) [Cm + f) ent to) + (m — f) em to)]] (to), 
3 (8) = (m— f) emtt-10 + (m ++ f) e=mtt-te) + 
se [Li emtE=t) — À e-mtt-10) | L (to). 


Remarquons que pour L (4) = 0, t5 — —o, l'expression (154) 
entraîne que 


lim (= —- = IRD = 2D (m4 pri, (26.155) 


r 


to —00 


ce qui confirme la validité de la relation (133) donnée dans ce qui 
précède. 


Avec L (to) Æ 0, to —> — co, (154) conduit à 


a 1 
lim Limite) TETE 
to — m—f+ À 1 (+0) m—f+ Li (to) 
D'après (155), 


(26.156) 


C'est pourquoi 
1 1 1 ie | 
mit) + lt) = (a+ ()], (26.157 
et l’expression (156) devient 


lim L(t) =. (26.158) 


to—>— 00 


Soit, maintenant, {, > —oo. Pour L (t&:) = 0, on obtient de (154) 


P 


—=i (26.159) 


Pour t, > —co, L (to) 0, on a, d’une façon analogue à (156), 


lim / (4) = CHEN Co Sr (26.160) 
_ m—f+— 1 (10) 


23—0393 
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Les relations (155), (156), (159) et (160), obtenues ici pour les 
processus aléatoires unidimensionnels, illustrent les théorèmes géné- 
raux de la théorie du filtrage ($ 29) des processus aléatoires multidi- 
mensionnels. 

6. Systèmes non stationnaires à temps infini d’observatien. 

Revenons maintenant aux équations (63) et (64) 


= f()z+w(e), 
z(t)=<c(t) +u(t). 


Supposons, comme précédemment, que les processus aléatoires w ({) 
et v (t) sont à moyennes nulles. Les fonctions de corrélation de ces 
processus s’écrivent 


M [w (t) w (x)] = q (t) ô (t — tv), 
M{v(hbu(ml=r(6(t— "), 
M {w (t) v (t)]l = 0. 


Supposons ensuite que les fonctions f (t), q (t) et r (t) vérifient les 
contraintes 


FAURES TEST 
0<La <g(t) LB: < ©, (26.161) 
0<La; <r(t) < B3 < co. 
L'équation différentielle de Riccati, vérifiée par la variance de 
l'erreur du filtre optimal Z (£f), est de la forme (125): 


dl 1 
x HOT + a). 


Désignons par Q (/) le second membre de cette équation 
Q (1) == 2f EI + q(t). (26.162) 
Pour une valeur fixée { — {*, les zéros de la fonction 2 (1) sont 
L()=ft)r() VAE) EE) +aE)r ET) <O, 
L()=f()r(E)+ VRP EME) + gr) >0. 
(26.163) 
Les inégalités (161) impliquent que pour tout {* la valeur [, (£*) 


est comprise entre les limites 
as < Lo (E°) < Ps (26.164) 


« 


ou 
OL a, = — asp: + V Bi + aus : 


RER 26.165 
Bi = BaBs + V BiB5 + BB . é 
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Donc, comme on le voit de (162), 


F=2()>0 pour LEI0, w), 
: (26.166) 
77 =Q(!)<0 pour LE(B, co). 


Les inégalités (166) permettent de conclure qu'à partir d'un certain 
instant ?, > {,, pour toute condition initiale L (4,) > 0, la solution 
de l'équation différentielle de Riccati (125) ne quitte pas le domaine 


0<La—e LL(t) L Ba + e Lo, (26.167) 


où e est une petite grandeur correspondante. 
Maintenant nous pouvons démontrer la stabilité asymptotique 
uniforme de la solution triviale de l’équation différentielle homogène 


= [1 ()- + 12 (26.168) 


construite à partir de l'équation différentielle du filtre optimal (66) 
avec z (1) = 0. 
Adoptons comme fonction de Liapounov la fonction 


# 1 e 
V (z. L) — TE L”. (26.169) 
En raison de (167) et (169), la fonction V (x, t) satisfait aux conditions 


1 
Bite 


—— SE EV (x, D<T Tr pour >. (26.170) 


La dérivée de la fonction V (x, t) par rapport au temps est de la forme 


dV __ OV. , OV dr __ 1 dl 5e, 1 95 
dt ot 95 dt (2(t) dt L(t) " dt 
ou 
dv 4 dl dr 
a 9 
. TE 2% > IL£ (26.174) 


En portant la valeur de S tirée de (125) et la valeur de = tirée de 
(168), réduisons l'expression (171) à la forme 


q(e) , Lt) __f_ a? ay —E 
-[ der r (1) 7 | V< (5 + F. }v pour {>#41. 
(26.172) 


Ainsi, T est strictement négative pour tout £ > £, et, donc, le filtre 


optimal est uniformément asymptotiquement stable. 
23* 
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Les résultats obtenus permettent également d'établir certaines 
propriétés des solutions de l'équation de Riccati (125). Désignons 
par Z(a)(#) et (b) (f) les solutions de l'équation différentielle (125) 
sous des conditions initiales (9) (£,) = 1,4) et (0) (4,) = 1,() res- 
pectivement. Ici{/,(«) et [,(b) sont des grandeurs positives (ou nulles). 

En introduisant les notations 


| GL (4) — La) () — LE) (4), (26.173) 
on aura 


d dia) (t) dltb (+) 
ou, d'après (125), 


7 LOL CE) = 2f (8 Le) (y — Te [IG (PIE + 


+00 — {2510 (US (PP + 40}. (26.175) 


r (t) 
En| désignant conformément à (103) et (124) 


0) (= (TO (SOS) LO (D, (26.176) 


on met l'équation (175) sous la forme 
d 
a LOL (E)1 = Este) (£) + 500) (4)] 67 (1). (26.177) 


Désignons conformément à (68) et (69) par ts) (#, v) la fonction d 
poids de l'équation différentielle (69) par #f® (6, +) la fonction de 


(a) 

En = sta) (4) Ete), (26.178) 

et par #(b) (f, t) la fonction de poids de l'équation différentielle 
b 

PE = 50) (9) EE), (26.179) 


Les solutions de ces équations sont 


BE) = po (6, Lo) 89 (bo), EE) = (1, LH) ED (to). (26.180) 
Puisque 
d 
nr WE, Lo) = 50 (#) DA) (6, to), 
nn. (26.181) 
7 VOICE Lo) = sb) (8) PO) (6, Lo), 
on montre sans peine que la solution de l'équation différentielle (177) 
s'écrit 
OL (E) = pa) (£, Lo) D) (£, to) OL (to). (26.182) 
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D'après (104) et (124), pourila valeur initiale /(a) (4,) — l,(2) de 
la variance de l'erreur, le filtre optimal est régi par l'équation dif- 
férentielle 


dxta) 
dl 


et pour la valeur initiale Z() (4,) — 1,0) de la variance de l'erreur, 
l'équation du filtre optimal est 


= sa) (f) xt) + TO z (t), (26.183) 


1b) (1) 


= b : 
= — s(b) (£) z(b) + Tr. Z (4). (26.184) 


Nous avons montré précédemment que quelle que soit la valeur 
initiale de la variance de l’erreur L (t), le filtre optimal est asympto- 
tiquement stable. Cela]signifie que 


lim (a) (4, to) = 0, lim DO) (1, to) = 0e (26.185) 
Î— 00 — 00 
11 résulte de (182) et (185) que lim (62 (1)] = 0 ou 
t—00 
Lim [UC (9) — 10) (#)] = 0, (26.186) 


c'est-à-dire que Les solutions de l'équation de Riccati (125), associées 
à des conditions initiales différentes, se rapprochent asymptotiquement 
quand t—+> oo. Cela signifie que toute solution de (125) tend vers 
une solution particulière ? (t) contenue dans le domaine {(167). Dési- 
gnant par L(t; Lo, t,) la solution de (125) qui satisfait à la condition 
initiale Z (4) = Lo, on peut définir { (t) de la façon suivante 

Jim L(£: 0, to) = (t). (26.187) 
De l’exposé ci-dessus il s'ensuit que toute soiution 2 (£; Lo, to) de 
l'équation de Riccati (125) qui vérifie la condition initiale Z ({,) = 
= l, > 0, où {9 > —, converge uniformément vers Î (t), où la 
fonction L (t) est définie par l'expression (187). En ce sens, T (#) est 
un état d'équilibre mobile qui vérifie l'équation différentielle (125). 


$ 27. Filtrage des processus 
aléatoires multidimensionnels 


1. Equation intégrale matricielle de Wiener de la fonction de 
poids optimale. Examinons le problème de filtrage des processus 
aléatoires multidimensionnels. Bornons-nous à l'étude des filtres 
constitués par des systèmes régis par des équations différentielles 
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Système initial 


Système conjugué 
du système initial 


Filtre optimal 


Système conjugué 
du filtre optimal 


Filtre du problème 
d'estimation 


Système d'équations 
différentielles vecto- 
riclles qui sert pour 
résoudre l'équation 
de Riccati 


SYSTÈMES STOCHASTIQUES 


Équation différentielle 


dr 

dy ; 
dp_ _ 
7 =F&e, 


F(t)=A(9—G (1 C(0), 
G (#)= S (4) C* (+) R-1 (4) 


DE 
sel" 


d 


dt 


> 


SE - — Fe (t)Ë, 


Fs it) = A9 (t)—C* (1) G* (4), 
G*(t)—RT1(#) C'(E) € (0) 


‘> 


dz 
7 A0 


— Hit, to) C* (1) X 
XR-1(t)C(t)]z 


dE 


DE — A (DE 
+ C*(#) R-1() C (Hp, 


= B (+) Q (E) B° (D E+ 


+A() pu 


linéaires à coefficients variables 


Ici p est le vecteur de dimension 7; F ({), la matricen X n; 
le vecteur de dimension m; G (ft), la matrice nr X m *. 


= F(Dp+6 (920. 


os me À comm, À rene 


Matrice 
fondamen- 


tale 


O(e) 


v (?) 


x (1) 


À (t) 


Ÿ (t) 


g (t) 


(CH. 6 


Tableau 


Matrice de 
Cauchy 


O (t, t) = 
= 6 (t) 6-1 (T) 


h(t, T) = 
=z:V (£) vr{ (t) 


W(t, t) = 
= #(t) x-1(t) 


At, T) = 
= Ÿ (t) Ê-1 (x) 


SE (t, +t)=- 
== Ÿ (4) 0-1 (+) 


I (t, +) = 
= g(t)g!(r) 


(27.1) 
z (4), 


* Les notations adoptées pour les matrices fondamentales des solutions 
et les matrices de Cauchy des équations différentielles vectorielles et des systè- 
mes d'équations vectorielles étudiés aux $$ 27-29 sont données dans le tableau. 
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Le processus aléatoire non stationnaire z () est un signal fourni 
à l'entrée du système. Le signal de sortie s'écrit 


t 
p (= (8, #0) p (a) + | Y(, D GR) z (mdr, (27.2) 
où i 
W(t, T)=x(t) x"! (r), (27.3) 


et où x (4) désigne la matrice fondamentale des solutions de l’équa- 
tion différentielle homogène 
2e. = F(t)p. (27.4) 
Avec 
P (to) = O0, (27.5) 
la sortie du système devient 


t 
p@= | Y(4, t)G(r)z(t)dr 
to 


ou 
t 
p (£) — | a(t, t)z(t) dr, (27.6) 
to 
où a (ft, t) désigne la matrice rn X m 
at, t)=V(t, +) G (rt). | (27.7) 


Introduisons la notation zx (t) pour le signal vectoriel de dimension 
n qu'on voudrait obtenir à la sortie du système. 
Par e (t) désignons l’erreur de reproduction du signal à obtenir 


e() = x) — p (6, (27.8) 
ou, en vertu de (6), 
e W=z()—\ at, t)z(t)dr. (27.9) 
to 


Supposons que zx (t) et z (t{) sont des processus aléatoires à moyen- 
nes nulles. De plus, conformément à (5), p ({) est également un pro- 
cessus aléatoire à moyenne nulle. 

Les matrices de corrélation des processus aléatoires concernés * 


* Ici, de même que précédemment, l’astérisque marque la matrice trans- 
posée. Le produit scalaire des vecteurs a et b est noté (a, b). Le symbole Sp À 
désigne la trace de la matrice À. 
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t 
L cov [x (t); z (o)] = M {zx (x) z* (o)), 
cov [x (rt): z (o)] = M {zx (x) z* (o)], (27.10) 
cov [z (xt): z (o)]l = M [z (x) z* (o)]. 


Adoptons comme mesure de la performance du filtre (I) la fonc- 
tionnelle 


J( =Mite(), et] =Mle* (te (t)] = Sp {Mle(t)e* (t)]}. 


(27.11) 
Conformément à (9), 


î 
M{e(t)e*(t)]=M {[z() = | a(t, T)z(r) dr| [ 2 () — 
to 
î 
_ | a(t, o)z(0) ds|'} =M{z()z°(0]— 
to 
_—_ MIz(t)z° (o)] a* (t, o) do — 
h 


— a(t, t)M{z(t)z* (t)] dt + 


to 
+ | a(t, ©) i M{z(t) 2° (o)]a* (t, o)dadr. (27.12) 
to 
On voit aisément que es matrices nr Xn 


Le (M: z° (c)]a*(t, ©) do, 
to 


(27.13) 


ns Le (t, TM{z(x)z* (t)]dr 


to 
satisfont à la condition 
L, = L*, (27.14) 
d’où l’on déduit que 
Sp (Li + Le) = 2iSp L:. (27.15) 
Ainsi, la fonctionnelle (11) devient 
t 


J(t)= Sp {M [z (6) z° ()] — 2 | Miz(t)z* (o)]a* (ft, o)do + 
to 


t t 
+ fat, r [Mt (o)a*(t, )dodr}. (27.16) 
to to 
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La grandeur J (t), mesure de l'erreur du filtre, dépend de la forme 
de la fonction de poids a (ft, t) = Y (t, t) G (x). Si a (t, +) est une 
fonction de poids optimale, c’est-à-dire si elle minimise la fonction- 
nelle J (f), cela signifie que pour toute autre fonction de poids 
at, t) + yh(t, +) (où y est un paramètre scalaire arbitraire indé- 
pendant de t et de t), la mesure de l’erreur du filtre est J (t) + ôJ (t) > 
> J (à. 

En vertu de (16),on a 


T9 + 67 (9 = Sp {M Ix(t) z° (11 — 


—2 | Miz(t)z* (o)][a(tf, o)4-vh(t, o)]° do + 


a Lo 


{ t 
+ Diet, 9) + 91 | Mis (0 2° (o)] ta (, o)+ 
to L 


+vh(e do dr}. (27.17) 
L'expression (17) peut être ramenée à la forme 
{ 
JAH ET (= 7 (2)+-Sp À —2r | M x (0) 2% (o)] F* (8, 0) do + 
to 


t { 
+7 [Ru 0 À Me Go 28 (o)1at (e, 0) do dr + 
to to 
t t 


+y Q ace, + À Ms Go) 2e (one (6, 0) do r+ 


to to 
+72 R(£, T) M{z(x)2* (o)] h* (t, o) do dr. (27.18) 
En introduisant les ns ° 
= | h(t, T) | Mfz(r)z* (o)]a* (ft, ©) do dx, (27.19) 
lo to 


t t 
Sa = | a(t, T) | M{z(x)z* (o)] h*(t, o) do dx, 


to lo 
t 


1= | h (4, T)z(x) dx (27.20) 


{o 
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et en tenant Pr de (6), on ME 
sim [7 h(t, t)2(T) « | {a (t, o)z(o)]* do=MIl(t)p*(t)], 
+ 
—=M at, T)z(T) dt | LA (4, o)z(o)]*do—=M{fp(t)l*(t)] 
to to 
Donc 
Se=S* (27.21) 
et par suite, 
Sp Si =Sp Se. (27.22) 
Si l'on tient compte de (22), il vient 
t - 
Sp[ —2v [Mix (2% Co) H* (8. 0) do + vS1+ 754 | - 
| to 
t 
=sp| — 2 | Miz(t)=% (o)]h® (4, a) do+ 
Le 
t 
2y | a({, T) MI{z(Tt):* (o)] h (t, Oo) do dr |= 
to to 
t 
= -2sp| | {Mist 2 (0)1— 
to 
t e 
- | at, t)M{z(x)2* (o)1 dr } Re (t, 0) do |= —2ySpJi(t), (27.23) 
t 
où ; 
t t 
J, pi À [z (4) (1 | ae, t)M{z(x):* Gide} à he(t, a) do. (27.24) 
to 
es maintenant le dernier terme de l'expression (18). En intro- 
duisant la notation 
t t 
Jo (t)= | h(t, T) | M{z(t)z* (o)] À*(t, ©) do dx, (27.25) 
t t 
on a en vertu de (20) ° ° 
t t 
Jo(t)=M [T«e, T) | 2 (T) =* (a) ke (t, ©) do dt — 
to {o 
t t 
—M { | h(t, T)2(T) dr | [A (4, o)z (o)j* a } —M{i(t)i*(t)]. (27.26) 


to to 
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On en déduit que 
Sp Ja (1) = ME (101 = MIU (9. 1) (27.27) 
et, donc, 
Sp Je (4) > 0. (27.28) 
D'après (23) et (25), l’expression (17) devient 
JD +ôJ(=J(t)—-2YSpJ() +v SpJ.(), (27.29) 
où J,(t) et J, (t) sont définis par les expressions (24) et (25). 
La condition nécessaire de minimisation de la fonctionnelle (11) 
s'écrit 
FU (4) + ôJ (t)],o =0 pour tout h (t, T). (27.30) 


En raison de (29), la condition (30) prend la forme 
Sp J, (t) = 0. (27.31) 

La condition (31) est non seulement nécessaire mais encore suf- 
fisante pour minimiser la fonctionnelle (11). En effet, pour Sp J, (t) — 
= 0, l'expression (29) devient 

[J (6) + 8J (Elrs0o = 7 (4) +% Sp: > J(0 (27.32) 
du fait que d’après (27) Sp J, (4) > 0 pour tout À ({, t). 

Puisque la condition (31) doit être remplie quelles que soient les 
fonctions h (£{, t), en vertu de (24) la condition de minimisation de 
la fonctionnelle M [ (e (£), e (t))] se met sous la forme 

Î 


lo 

De la sorte, la matrice a (t, t) detype nr X m, qui est une fonction 
de poids optimale du filtre, doit satisfaire à l’équation intégrale 
matricielle (33). Cette équation s'appelle équation de Wiener. 

L'équation intégrale de Wiener (33) entraîne les deux relations 
suivantes qui traduisent le contenu du lemme utilisé dans la théorie 
du filtrage linéaire [25, p. 238], relatif à la projection orthogonale 
dans un espace de Hilbert. 

L'équation (33) peut s'écrire 


M{[-0— | a(£, T)z(xT) dr | 2” (o) } = 0, LOL, 
to 


ou, d’après (6), 
M {{xz (t) — p(t)1z* (o)} = O, lb <O< lt. 
Conformément à (8) cette relation prend la forme 
M le (4) z* (o)] = 0, bo LOL. (27.34) 
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Pour obtenir la deuxième relation, considérons l'expression (6). 
En transposant ses premier et second membres, on obtient 


p° (4) = | z* (o)a* (t, o) do. 


La multiplication à gauche du premier et du second membre de cette 
relation par e (t) donne 
Î 


e(t)p° (t)= | e(t)2*(o)a* (t, a) do. 


En remplaçant le premier et le second membre par leurs espéran- 
ces mathématiques, on trouve 


M{e(t)p* (#)]= | M{e(t)2° (o)]a* (#, o)do. 


D'après (34), le second membre de la relation obtenue est nul. Par 
conséquent 


M le (t) p* ()] = 0. (27.35) 


2. Filtres optimaux de Kalman-Bucy. Etudions le système li- 
néaire régi par l'équation différentielle vectorielle 


= A(z+B (t)w (6). (27.36) 


Ici z est le vecteur de dimension » ; À (t), la matrice nr X nr; w (t), 
le processus aléatoire vectoriel de dimension r; B (t), la matrice 
n xXT. 

On définit par observation le vecteur z de dimension m décrit 
par ‘la relation 


2H =C(Hz(t+v(t, (27.37) 


où C (t) est la matrice m X n; v (t), le processus aléatoire vectoriel 
de dimension m. Nous avons supposé le système (36), (37) complète- 
ment observable avec w (t) = 0 et v (t) = 0. 

Les processus aléatoires w (t) et v(t) sont des bruits blancs 
gaussiens à moyennes nulles. Leurs matrices de corrélation s'’écrivent 


cov [w (4); w (x)] = M [w (t) w* (x)] = Q (t) 8 (t — ), 
covlv(t); v(rt)] = M {v (ft) v* (r)] — A (£) Ô (4 — +), (27.38) 
cov [w (): v (t)] = M [w (6) v* (x)] = 


où Ô (£) est la fonction impulsion de 2 Q (t), la matricer xr 
symétrique définie non négative; R (t), la matrice m X m symétri- 
que définie positive. 
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Supposons que zx (t,) soit le vecteur aléatoire gaussien de dimen- 
sion r à*moyenne nulle 


M [x (to)]. = 0 (27.39) 
et à matrice de corrélation 
M [x (t,) z* (to)] = Zo; (27.40) 


de plus, la matrice définie non négative Z, est supposée connue. 
Supposons encore que w (t), v (t) et x (f,) soient non corrélés. 
Remarquons que puisque w (t) est un processus aléatoire à moyen- 
ne nulle, (39) entraîne que M {x (t)] = O0 pour tout f, c’est-à-dire 
z(t) est un processus aléatoire à moyenne nulle. 
Cherchons le filtre décrit par l’équation différentielle vectorielle 


PB F(Hp+G(2(),  p(t)=0 (27.41) 


dont la sortie, le vecteur p (t) de dimension n, serait une estimation 
optimale zx (t) de l’état du système x (t): 

z (t) = p (t). (27.42) 
L'erreur d'estimation 

e(t) =zx(t) — p (6) (27.43) 


peut s'appeler erreur du filtre. 
Le signal de sortie du filtre (41) est 


t 
p({) = | WE, T)G(x)z(x) dr, (27.44) 

où 7 
Yo, t)=x(t x"! (7) (27.45) 


et x (t) désigne la matrice fondamentale des solutions de l'équation 
différentielle vectorielle homogène 


P =F(:) p. (21.46) 
Désignons par a(t, t) la matrice nr X m 
at, t)=V(t, +) G (x). (27.47) 


Constatons que puisque 
TH, D =x(D x! (D =E, 
où Æ est la matrice unité, il vient 


a (t, t) = G (t). (27.48) 
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Conformément à (47), la sortie du filtre, définie par l’expres- 
sion (44), peut s’écrire 
4 


p(t) = f a(t, T)z(r)dr. (27.49) 
lo 
Le choix des paramètres du filtre (41), c’est-à-dire des fonctions 
F (t) et G(t), doit assurer la minimisation de la fonctionnelle 
J(D = Mltet(t), e(t))l. (27.50) 


Introduisons la notation © ({) pour la matrice de corrélation de 
l'erreur du filtre 


S (D =Mle(t)e* (t)]. (27.51) 
Notons que puisque d’après (41) p (4) = 0, il vient 
e (to) = Z (to) — P (to) = Z (to); (27.52) 
et conformément à (40), on a 
5; (£o) — > (27.53) 


On voit sans peine que dans notre problème la fonction de poids 
a (t, +) du filtre optimal doit vérifier l'équation intégrale de Wiener 
(33) obtenue dans ce qui précède : 


L 
fat ME (D: (1 = Mir)" (0), Ho <t. (21.54) 


La fonction de poids matricielle a (f, t) qui satisfait à l'équation 
intégrale matricielle (54) minimise, comme nous l'avons montré 
au paragraphe précédent, la fonctionnelle (50). 

Détermination de la fonction #(t). En deéri- 
vant par rapport à { les deux membres de (54), on obtient 


t 
| at, r)M{z(r) 2 (o)}dr+a (4, #)Mz(t)2* (o)1= 
to 


= LMI (0)  H&o<t. (27.55) 
Considérons le second membre de cette relation. D'après (36), on a 


_ M{z (42° (6) = M ES 2% (0) | _M{[A()z (+ B(tw(1)]z" (0)}— 


—A(t)M{z(t)5*(0)]+B(t)M{w(t)z*(o)]. (27.56) 
D'après (37), 
2% (0)=z* (0) C* (o)+v* (o), (27.57) 
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donc, 
Miw(t)z*(0)]=Mlw(t)z* (0)]C* (0) KM [w (t) v® (o)], 
et comme, d'après (38), M{w (t)v* (o)]=0, on obtient 
M{w(t)z*(0)]=M{uw(t) z* (o)]C* (0). (27.58) 


La solution de l'équation différentielle (36) s'écrit 
[e 
z(o)=© (0, to) 2 (to)+ | (oc, t)B(t)w(T) dr, (27.59) 
lo 


où 


O (t, t) = 6 (4) 0-1 (tr), 


et 6 (t) est la matrice fondamentale des solutions de l'équation homogène 


dx 
dt = À (t) Le 


De cette façon, 


M [w (+) z° (o)] = M [w (1) z° (to)] ®* (0, ito) + 


o 
+ M [w (t) w* (rx)] B* (t) ®* (o, +) dt. (27.60) 
to 


Le premier terme du second membre de la relation (60) s’annule en vertu de 
l'hypothèse suivant laquelle z (t,) et w (t) sont non corrélés. Le deuxième terme 
du second membre de (60) contient dans l’expression sous le signe somme le 
facteur M [w (t) w® (t)] = Q (t) 50 (t— +), où TE (to, ol. C'est pourquoi pour 
tout o Et, t)on at <tet la fonction Ô (t — +) s’annule. Le deuxième terme 
du second membre de (60) est alors nul et la relation (60) devient 


M.{w (t) z° (o)] = 0, bh EG <t. (27.61) 
Les relations (61) et (58) entraînent 
M{w(t)=* (0) =0, t<o<t. (27.62) 


Ainsi, conformément à (56) et (62), on a 
Miz(t)2 (0)1=A(D MIz(t)2* (0),  to<o<t. (27.63) 


Examinons maintenant le premier membre de la relation (55). D'après (37) 
M [2 (4):° (o)]] = M {[C (1) z () + v (12° (o)} = 
= C(9 Mlz(t)2* (o)]+ M {v (#) 2° (o)]. (27.64) 
On a en vertu de (57) 
M [v (1) :* (o)] = M {v (t) z° (o)] C* (o) + 
+ Mo (t) v* (o)] = M {v (1) z° (o)] C* (o), t So <t, (27.65) 
du fait que Mf{v (t)v* (o)] = 0 pour © < 1. 
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Il s'ensuit de (59) que 
Mlv(t)z* (o)] = M {v (+) 2° (to) O (0, to) + 
o 


+ | M [u (4) w* (x)] B* (7) O® (a, +) dr. 
to 


D'après (38), M à = 0, et d l'hypothè 
pe Sont ne RS LE de 6. si TOR AN PORN) 
Par conséquent, 
M [v (t)z* (o)]] = 0, (27.66) 
d'où, d’après (65), 
M{v(t):*(0)]=0,  t<o<t. (27.67) 
Ainsi, la relation (64) devient 
M{z(t)z®(o)]=C(t)M{z(t)z* (0), to <o<t. (27.68) 
Conformément à (63) et à (68), l'équation (55) se met sous la 
forme 
(A (t)—a(,t)C()1MIz(E) z° (o)] — 
t 
— | La (t, T)M[z(t)z* (o)] dr = 0, tLO<t. (27.69) 
to 


La substitution dans l'équation (69) de M{z(f)z* (o)] par sa valeur 
tirée de (54), donne 

t 
[A()—a(t, b C(E)] | a(t, Tt)M[z(x)z° (o)] dt — 


to 
t 


_ | af T)Mls(T2"(o)]dr=0,  HEo<t, 
to 
ou 


| [À (£) a (é, + a(t,t)—a(t,t)C(t)a(t, t)]M{z(x)z*(o)]dr=0, 
{o 


to LO À (27.70) 
En introduisant les notations 
b(t,t)=A(ta(t, t—<L at, t)—a(t,t)C(t)a(t,r), (27.71) 
on ramène l'équation (70) à la forme 
Î 


| b(t, T)M[{z(x)z* (o)] dt =0, L LOL. (27.72) 


lo 
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L’addition des premiers et des seconds membres des équations (54) 
et (72) conduit à l'équation 


t 
À la(é,t)+b(t,t)]M[z(x)z* (o)] dr = Mix (t) 2° (o)], too <t. (27.73) 


De la sorte, la fonction a(t, t) de même que; la fonction 
at, t) + bit, tr) sont des solutions de l'équation intégrale de 
Wiener (54), c’est-à-dire ces fonctions minimisent la fonctionnelle 
(50). 

Il est aisé de montrer que puisque la matrice À (t) intervenant 
dans l’expression (38) est supposée définie positive, la différence 
entre les deux solutions obtenues de (54) est nulle 


[a (it, t)+b(t, T)])]— at, rt) = 0, to LT t. 
Pour le démontrer, considérons la relation (34) 
Mle(t)z* (o)] = 0, th LO <t. 


Les fonctions a (4, t) et a (t, t) + b (t, +) sont des solutions de (54). D’après 
(49), à la fonction a ({, T) correspond l'estimation optimale 


î 
= | a(t, T)z(x)ar. 
to 
A la fonction a (4, t) + b (t, t) correspond l'estimation optimale 


t 
z (t)= | [a(é, T)+b(t, t)]z (T7) dr. (27.74) 

t 

En désignant ° 
e(t)=z(t)—7(t) (27.175) 

On aura 
t 

e(9= | b(t, t)z(t) dr. (27.76) 


to 
La condition (34) entraîne les relations 
M{z(@)—2(912 (0)}=0, M {z() —2z(1)12* (0)} = 0, 
d'où l’on déduit que 
M [e (#)z° (o)] = 0. (27. 
Considérons maintenant les relations (49) et (74) qui conduisent à 


—] 
—] 
CS | 
us’ 


t 
M{e(t)z*(t)] = | M{e(t)z*(o)]a® (t, o) do, 
to 
L4 
Me (e)2* (D]1= Ÿ Me (0) 2* (o)} {a (4, o)+b (4, ani* do. 
to 
24—0393 
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Comme d'après (77) les seconds membres de ces relations sont nuls, on a 


M{e(t)z* (]=0,  Mle(t)z* (]= 0. 
Il en résulte que 
M {e(t){z()—Zz(1]*} = Me (e) e* (] = 0. 
En portant dans (78) la valeur de & (t), on obtient d'après (76) 


M i b(t, t)z(t) dt + (0) b® (t, o) ao |= 
t t 


= | b(t, t) | Mf{z(T)z* (o)]b* (t, o) do dr = 0. 
to lo 
Conformément à (37), 
M{z(T) 2: (0) = M {y (7) + v ()] [y* (o) + v* (o)]}, 
y (4) = C(t) x (+). 


où 


(22.78) 


(27.79) 


(27.80) 
(27.81) 


Puisque d’après (38), M [w (t) v* (t)] = 0, les processus aléatoires z (4) et v (t} 


sont non corrélés. L'expression (80) devient donc 
M{z(7)2° (o)] = M [y (r) y° (o)] + M [v (x) v* (0)] = 


= My (t) y° (o)] + R (x) 6 (t — 0). 
D'après (82), la relation (79) s'écrit 


t t 
6e, 7) Ÿ Mu Cr) v° Co)18* (eo) do à+ 
to to 


î 


(27.82) 


t 
+ b(t, +) R(x) ô(r— a) b® (t, o)dor=0, 
j | 


to 
ou 


M {( b(t, putoér | [b(t, o) y (o)]* a }+ 
to DA 


t 
+ | b(t, T)R(t)b® (t, t) dt =0. 
to 
En introduisant la notation 
t 
Au= fo, nya 
to 
réduisons. la relation (83) à la forme 


{ 
M [A (#) À° (#)] | b(t, t)R(x)b%(L, t) dt=0. 
{a 


(27.83) 


(27.84) 


(27.85} 
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Notons que puisque zx ({) est un ‘processus aléatoire à moyenne nulle, les 
moyennes des processus aléatoires y (t) et À (t) sont nulles elles aussi. 

On vérifie facilement que la condition b (ft, t) = 0, to ST <'t, est suffi- 
sante pour que la relation (85) soit réalisée. 

Montrons que cette condition est également nécessaire pour que la relation 
(85) soit réalisée. 

Remarquons que les éléments de la matrice M [À (t) À* (t)] qui se situent sur 
sa diagonale principale M [A (t)] > 0. 


Par hypothèse, la matrice R (t) est symétrique définie positive. Elle peut 
donc être mise sous la forme 


R(= S (1 S* (t), (27.86) 


où S (t) est une matrice réelle régulière. En désignant par U (ft, t) la matrice 
nxX m 


U(t, T)=b(t, T)S (T), (27.87) 
on peut représenter la fonction sous le signe somme de (85) comme suit 
Pt, T=b(t, T)R(T) db (ft, +) = 


= bft TS (TS (TDb*(t, T)= Ut, Tr) U* (1, T). (27.88) 
Les éléments diagonaux de la matrice l (f, +) de type n X n sont 


lutt, t)= SUR (, 7), id, ...,n. (27.89) 


CR | 


Donc, pour annuler les éléments de la diagonale principale de la matrice nr X n 
t 


T(t, = | b(t,t)R(t)b* (t, t) dr, (27.90) 
to 
il faut remplir la condition 
U(t, T)=b(t, t) S (t) = 0. (27.91) 
Puisque 
b(t, t)= U(t, +) S-1(t), (27.92) 


la condition (91) devient b (t, t) = 0. 

Si l'on tient compte encore que M [A? (t)] > 0, où À (1) est définie par l'ex- 
pression (84), on peut conclure que la condition b (t, %) = 0, 4 ST <t est 
nécessaire pour que les éléments de la diagonale principale de la matrice n X n 


{ 
M [à (+) à° @1+ b(t, T)R(t)b® (4, 7) dt 
to 


soient nuls. Pour observer la relation (85), la condition b (t, 1) = 0,14, <7T<t 
est donc non seulement suffisante mais encore nécessaire. 


Ainsi la relation (85) implique que 
b(t, t) = 0, bb LT. (27.93) 
Il résulte de (93) et (71) que 
_. a(t,t)=A(tha(t, T1—a(t,t) C(tha(t, t). (27.94) 
24* 
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Considérons maintenant la relation (49). En dérivant ses deux 
membres par rapport à £{, on obtient 


#-[3 at, T)z(tdr+a(t, t)z(t) (27.95) 
ou, en vertu de 4), 


æ [A(é)a(t, T)—a(t, t)C(tha(t, t)jz(t)dr+a(t, t)z(t) = 


={A({)—a(#, t)C(t)] | a(t,t)z(t)dr+a(t,t)z(t) = 


={[A(t)—a(t 1)C()p(t+a(tt)z(#). (27.96) 


Si l’on tient compte que d’après (48), a (6, t) = G (t), et que d’après 
(41), p (t) = 0, l'équation (96) se met sous la forme 


P=(A(D—G(H)C(HIP+G(Ez(),  P()=0. (27.97) 
Les équations (97) et (41) montrent que la fonction F (t) de l’équa- 


tion (41) s'écrit 
F(h=A(D —-G(bC(E. (27.98) 
Ainsi le filtre optimal, dont l'équation (97) peut s’écrire 


P=A(HP+G(HIz(—C(HP)  P()=0, (27.99) 


est un système à retour dans lequel l'écart entre avec un gain G (ft). 
Détermination de la fonction Gt). Considé- 
rons l'équation (54): 


t 
M {zx (4) z° (o)] — | a(t,Tt)M{z(Tt)z*(o)]dr=0, 45<o<t. (27.100) 
A) 
D'après (37), 
M{z(t) 2% (o)] = M {x (#) [IC (o) x (0) + v (o)l* } = 
= Mlz (t) z* (o)] C* (o) + M [zx (t) v* (o)1. (27.101) 
Conformément à (59), 


z(t) =D (4, to) x (to) + | O(t,t)B(t)w(x)dr,* (27.102) 
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d'où l’on déduit que 
M{z (2) v* (o)1=© (#, to) M[z (to) v° (0)] + 

+ D(t,1t)B(t)M{w(t)v*(o)]dr=—0, (27.103) 


puisque M [zx (£,) v* (o) — 0 et M {w (x) v* (o)] = 0. 
Ainsi, l'expression (101) Sdevient 
M [x (t) z* (o)] = M fx (#) x* (o)] C* (0). (27.104) 
En vertu de (37) 
M [2 (x) 2* (0)] = M {z (x) IC (0) x (6) + v (o)l*} = 
= Mfz (x) z* (o)] C* (o) + M [z (7) v* (o)] = 
= Mlz (1) z* (o)] C* (o) + 
+ M {IC (mr) x (Tr) + v (lv (o)} = 
= M{z (x) z* (o)] C* (o) + R (x) 6 (t — 0), (27.105) 
comme M [zx (x) v* (o)] = 0. 
En portant (104) et (105) dans (100), il vient 
t 
M{z (6) z° (0)] C* (o)— | a(t,T)M{z(x)z* (o)]C* (o) dt — 


10 
Î 

— | a(t,t)R(rx)ô(T—o)dt=0, t<o<!t, 
to 


ou 
a(t, o)R(o)=M [x(t) 2° (0)]C* (0) — 
t 


— | a(t, t)Mf{z(x)z° (o)]C* (o) dr, t0ZOLt. (27.106) 


Comme les deux membres de la relation (106) sont des fonctions 
continues de ©, cette relation est vraie également pour 6 = t. 
On a donc, enktenant compte du fait que a (ff t) =IG (t), 

Î 
G(t)R(=MlIz(t)z* (t)]C* @— at, t)M{z(T)z° (4)] C* (t) dr, 
to 
ou, conformément à (49) et (43), 


T 
G(R(=M {[:@— | a(t, t)z(r) dr | 2° ()} C* (= 
to 
= M{fz()—0()1z" (#}C* (1) =Mlte(e) x" (41C* (4. (27.107) 


314 SYSTÈMES STOCHASTIQUES [CH. 6 


Etant donné que 
z(t) =e(t) +p(t), 
il vient 
M le (t) x* (t)] = Me (t) Le (4) + p (01*} = 
= M{e(t)e* (1 + Mlle (t) p* (0)]. 
D'après (35), M {e (t) p* (t)] = 0. Aïnsi, (51) conduit à 


M le (4) x* (t)] = © (4. (27.108) 
La relation (107) devient 
G(DR (t) = E (0 C* (+). (27.109) 


Comme R (t) est une matrice définie positive, on trouve à partir 
de (109): 


G(D => (0 C* (0 R1(. (27.110) 


Détermination de la fonction ÆZ(t). D'après 
(43), 


e(t)=2z(t) —p(). 
et donc 


Conformément à (36) et (99), cette relation se met sous la forme 
= A()z+B(tw()—A(Dp—G(t1z()—C()e1= 
— A(tje+B(t}w(t)—G(H{C()r+v(t)—C(t)pl]; 
ou 
=14A(D—G()C(Dle+B(Dw()—G()v(. (27.111) 


Etant donné que w (ft) et v(t) sont des processus aléatoires 
à moyennes nulles, il résulte de (111) que e (t) est également un 
processus aléatoire à moyenne nulle. 


D'après (45) et (98), x(£) est la matrice fondamentale des solutions 
de l'équation homogène 


Se ={[A(t)—G(t)C(t)le. (27.112) 


Ci-dessus nous avons désigné par Y (f, t) la matrice (45) de type 
nxXn: 


VW, t)=x(t) x"! (x). 
La solution de l'équation (111) peut s’écrire 


t . 
e(t)= Ÿ(E to) e(to)+ | W,Tt)[B(t)w(t)—G(r)v(r)ldr. (27.113) 
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En vertu de (51) et (113) et compte tenu du fait que w (t) et 
v (t) sont non corrélés par rapport à e(£) =zx(t), on a 


2 (= Mle()e" (01= Y (6, to) M Le (fo) e* (t0)1 Ÿ* (6, do) + 
t t 
+M{ | Y'(t, T)[B(t)w(r) —G(chv(r)] dt | [w* (a) B* (6) — 
to to 


—v* (0) G* (o)] Y*(£, 0) do } . (27.114) 


Conformément à (53) et (38), l'expression (114) devient 


t 
E (4) = Ÿ (be to) 20° (6, t)+ | WE, +) [B (7) Q(r) B* (r)+ 


+G(T)R(T)G*(T)] T° (6, t)dt. (27.115) 


D'après (110), il faut porter dans l’équation (114) la valeur G (t) = 
— Ÿ (t) C* (x) R-! (x). De la sorte, l'équation (115) présente une 
équation intégrale matricielle par rapport à la matrice Z ({) de: 
type nr X n. 


Passons de cette équation à l'équation différentielle équivalente. 
En dérivant les deux membres de (115) par rapport à £ on obtient 


dE 


+= 0) 5e (£, to) + Y(£, to) Zo Cho) + 
+Y(,D(B(HQ()B*()+G()R(1)G*()] EL (4, + 


: . 
+ [AD (8 (0) Q (1) B° (046 (9 (N° (IP Ddr+ 


ee | W(£, t) LB (+) Q (x) B* (x) + G (x) R (1) G* (1)] ED 07. (27.116) 


D'après (98), 
F(b=A(D—G(tC (tr). 


En vertu de (112) ot (98), = F(#) x (4). C'est pourquoi con- 
formément à (45), on a 


dY (1,7) = 0 
ot 
MCD pa t( = (TE). (27.117) 


x (T)=F() (ET), 
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En retenant que Y (f, t) = E, où E est une matrice unité, et que 
d’après (115), 


t 
| Wt,t)(B(T)Q(T)B*(T)+G(T)R(T)G* (x) F° (4, Tr) dt — 
io 


=X(t)— (ét) Zo*(t, to), (27.118) 
ramenons l'équation (116) à la forme 


À = F (4) Ÿ (6 to) 20 T° (6 to) + Ÿ (Edo) ZE (Es to)F* (1) + 


+8 (+) Q (+) B°(8)+6G (6) RE) G* ()+F () IE ()—T (8 to) ZoT* (4, to)]+ 
+ > (£) —Y (4, lo) ZoT° (e, Lo)] dé (£), 
ou 
= F()E+SF" (+ G()R(DG"()+B(HQ()B*(. (21.119) 
Portons dans l'équation (419) la valeur de F (t) pour obtenir 
d'après (98) 
+= A ()2+24*()—G(H)C(E2—2C()G*()+GG)K(E)G*() + 
+B(t)Q(t)B*(t). (27.120) 
Si l’on substitue à G (t) sa valeur tirée de (110) et si l’on tient compte 
que d’après (53) Z (4) = Z,, on obtient l'équation différentielle 
= A(E) 2H SA (HD —5C* (8) (D C()E+ 
+B(DQ(9B°(), Z(%)=20 (21.121) 


que vérifie la matrice Z (£) de type rz X n. 

L'équation (121) est une équation différentielle matricielle de 
Riccati. 

Maintenant d'après (110) on peut écrire l'équation différentielle 
(99) du filtre optimal sous la forme 


= [4 ()— 2 (9 C* (D RD C(D1p+ 
+Z2()C* (4) R1(t)z(t), P(to)—=0, (27.122) 
où Z (ti) est une solution de l'équation (121). 


3. Méthode de résolution par approximations successives de l'équation 
différentielle matricielle de Riccati. L'équation de Riccati (121) s'écrit 


= = A(t) 2H SAS (+) —XC% (4) R-1 (+) C (+) 2 


+8 (1) Q (+) B* (1). Z (to) = [> 0. 
Ici R(t) est la matrice symétrique définie positive, Q (t) et T des matrices 
symétriques définies non négatives. 
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Introduisons les notations 
R(H—=C* (4) RTA(1) C (4), 
7. 
L(t}=8B(t) Q (+) B* (+). Eee 
L'équation (121) devient 
= A (DE TA (D— ER (D E+L(), EG=T>O0 (27.124) 


Pour résoudre l'équation (124), on peut appliquer le processus itératif 
suivant. Les approximations successives de la solution de 424 Z(0) (#2), Z(H (+), 
29 (1), ..., 2-0 (4), 2 (4), ... s'obtiennent à partir des équations diffé- 
rentielles linéaires 


a == À (t) SOL SCO)AS () LL (t), 20 (to) =T > 0, 
E = (4 (t)— SON (2)] EH + 2H [AS (2) —R (4) SO] 

HOR (+) EOHL (+), ZE (t)=T > 0, 
+ = [A (+) — 20 (81 2 + 20 [AS (4) —R (4) 2H] + 

HEOR()SDEL(E, ES (to) =T > 0, 
2 (A (6) — 5en-2 (1) Sen-D + 5e [A (4) () 3-2) + 

HEM-29 (1) EM-D EL (+), 2-9 (to) =T > 0, 

Lu = [A (4)— 2m DR (8)] ZM + EM [AS (4) — R (4) ZM D] + 


+ 2m-0R (+) ZM) + L (+), ZM (t)=T 2>0, 


(27.125) 

Introduisons les notations 
An = 2m — Zn, (27.126) 
Ân=A(t)—2m-0R (1). (27.127) 


Constatons que puisque Z(7) et Z(7-1) sont des matrices symétriques, A, est 
également une matrice symétrique. 
Avec n > 2, des équations différentielles que vérifient Z(% et Z"-1) on 
trouve que À, satisfait à l'équation différentielle suivante 
dAh 
dt 
. Remarquons encore que conformément à (126) l'équation différentielle (125) 
vérifiée par la matrice Z(7) peut se mettre sous la forme 
dEtn) 
dt 


= Ann AnA% — An (t) Ant nZ2% An(to)=0. (27.128) 


— À (+) ZM) EM) AS (2) AA (8) Re (4) An (4) — EUR (+) EMILE (y, 
tm (H)=rT>0. (27.129) 
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L'équation différentielle matricielle (129) est équivalente à l'équation 
intégrale matricielle 


t 
Em) (e) = © (#3 to) TO* (4, to) + | © (1, r) LL (t)— 20 (7) R (x) EU (T) + 
to 
An (T)R(T)An(T)O*(4, r)dr, (27.130) 
où 
O(t, t) = 6 (1) 0-7 (r), 
et 6 (4) est la matrice fondamentale des solutions de l'équation différentielle 
vectorielle 
dz 
Pr = À (#) Z. - 
D'une façon analogue, l'équation différentielle vectorielle de Riccati (124) 
est équivalente à l'équation intégrale matricielle 
Z (1) = (+, to) TO* (t, to) + 
t 


ne [ O(t,t)[L(t)—ZS(T)R(T)Z(T)]O* (4, t) dt, (27.131) 
: 
En introduisant 7e notations 


Pa (ET) = Xn (4) Xnt (T); 


OÙ Xn ( est la matrice fondamentale des solutions de l'équation différentielle 
vectorielle 


n _ An (t) Pn 


et en tenant compte que À, (to) = 0, cherchons la solution de l'équation diffé- 
rentielle matricielle (128) sous la forme 


t 
An ()= — [Yn (t, 7) Ans (t) HR (T) Ana (r) PA, Tdt<O0, n>2. 
{ 
° (27.132) 


Dans ces conditions, pour tout £ et n > 1, ZM) (t) > 0, du fait que d'après 
(125) 


EG) (4) = Pa (4, to) T'ES (4, to) + 
t 


+ | Ya, TIL(T)+Em-D (T)N (T)2M-D (t)] PA (4, that, (27.133) 
to 
Théorème. Soit la matrice Z(0(t) => 0 pour tout t et dérivable par rapport 
àt. Dans ce cas, sur chaque intervalle fini (to, T) on a la relation ZM) (t) < 
<EM-) (+), n > 1Â,et pour n — © la suite des matrices {ZM (t)} converge uni- 
formément vers la solution Z @ de l'équation de Riccati (124). 
Démonstration. Ils'ensuit de (125) que 


Ê t | 
SO (4) = © (4, to) TO* (#4, t)+ | O(t,t)L(T)@*(t, that, (27.134) 
to 


et puisque L (+) est une matrice symétrique définie non négative on a Z(0 (4) > 0 
pour tout ?# E (to, T), comme le prévoient les conditions du théorème. 
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D'après (132), A, (t) < 0 pour n >2, soit Zn) (4)  ZN-L (4) pour 
n > 2 et pour tout {. Ainsi, on a la suite des matrices 


0<...< MH) SEM (EL... << 29 (1 LED (4). 


(Constatons que l'inégalité Z(9 (4) > ZX) (t) peut ne pas avoir lieu.) 
Comme d'après (125) 


ED ()=Wi(t, to) T'ES (t, to) + 
[4 
+[ Wale, T)[ZO (T) R (T) LEO (T)+L(x)] FE (4, tr) dr, (27.135) 
to 


on 4 . op I ED (t)]| < À < co. On en tire suivant le théorème de la con- 
0, 


vergence monotone des opérateurs positifs dans un espace de Hilbert [38] que 
lim 2 (t) = E (t),tEfto, T], où la matrice Z (t) vérifie l'équation intégrale 
n— oo 


(1) =O (6, to) TO* (4, to) + 


HU O(4, TL(TD—E (TDR (T Étr)]D* (4, +) dr (27.136) 


St 


qui diffère de l'équation intégrale (130) vérifiée par la matrice X(® (t) par l'ab- 
sence dans le second membre du terme 


t 
Î @6, 9 Au (99 (9) Au (9e (, ar, (27.137) 
to 
où A, (t) R (1) À, (t) est une matrice symétrique définie non négative. 
(136) et (131) impliquent que 
ES (G)= 2 (1). (27.138) 


où © (t)est une solution d el’équation de Riccati (124). Le théorème est démontré 


$ 28. Application du principe 
du maximum de Pontriaguine à la théorie 
des filtres optimaux de Kalman-Bucy 


Au $ 27 nous avons construit les filtres optimaux de Kalman- 
Bucy sur la base de l'équation intégrale de Wiener. Dans ce qui 
suit, sous des hypothèses quelques peu plus générales sur la fonction- 
nelle qui donne la performance du filtrage, nous exposons le mode 
de construction des filtres de Kalman-Bucy basé sur le principe 
du maximum de Pontriaguine. 

Considérons le système linéaire non stationnaire 


= A(z+B (6) w(t). 


28. 


380 SYSTÈMES STOCHASTIQUES [CH. 6 


Ici x est le vecteur de dimension nr d'état du système ; w (t), le vecteur 
de dimension 7 qui est une entrée du système; y(t), le vecteur 
de dimension m qui détermine la sortie du système ; À h. la matrice 
nxn; B(t),lamatricen X r;C (t),la matricem X nr. Le système (I) 
est supposé complètement observable. 

L'entrée w (t) est un processus aléatoire vectoriel gaussien du 
type bruit blanc à moyenne nulle 


M [w (t)] = O0 pour tout t (28.2) 


et à matrice de corrélation 

cov [w (4); w (t)] = M {w (rt) w* (x)] = ô(t— +) Q (1), (28.3) 
où Ô (t) est la fonction impulsion de Dirac, et © (t), la matrice 
symétrique définie non négative r Xr. 

Soit {, l'instant initial (£4, > —), et le vecteur zx (ft) l'état 
initial du système. On suppose que zx (t,) est une variable aléatoire 
vectorielle gaussienne indépendante de w (f) à moyenne connue 


M {x (to)] = Zo, (28.4) 
et à matrice de corrélation connue 
cov {x (to); x (t0)] = M {fx (to) — zo] [x (to) — zol* } = Zoe (28.5) 


Sous les hypothèses que nous venons de faire ci-dessus, zx (t) et 
y (t) sont des processus aléatoires gaussiens. 

Supposons que l’observation du vecteur y (t) ait lieu en présence 
des perturbations du type bruit blanc gaussien et, de ce fait, le 
signal observé est de la forme 


2() = y(t+v(t = C( zx () + v (à, (28.6) 
où v (t) est un bruit blanc gaussien à moyenne nulle 
M [v (t)] = 0 pour tout t# (28.7) 


et à matrice de corrélation 
cov [v (4); v (t)] = M [v (t) v* (x)] = 6 (t — +) R (1), (28.8) 


avec R (t), la matrice symétrique définie positive m X m. Sup- 
posons de plus que v (t), w (f) et x (f,) soient non corrélés et, par 
conséquent, indépendants. k 

On demande d'obtenir l'estimation zx (t) de l’état x (f) du systè- 
me (1) à partir du vecteur fonction z (t) observable dans l'intervalle 
de temps Î[t,, TI]. (Les vecteurs fonctions zx ({) et y (t) ne sont pas 
mesurables directement.) Appelons filtre le système qui détermine 
le vecteur x (t). Nous allons nous borner ici aux filtres qui constituent 
des systèmes linéaires non stationnaires de la forme 


= F(Hp+6G(#)2(0), (28.9) 
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où p (f) est le vecteur de dimension nr; F'(t), la matricen Xn; 
G (t), la matrice z X m. Le vecteur fonction p (£) est adopté comme 


estimation zx (t) de l’état x ({) du système initial (I) 


z (t) = p (t). (28.10) 
Conformément à (40), l’erreur d'estimation e(t) = x (t) — x (t) s'écrit 
eD=z( —p(. (28.11) 


Le vecteur fonction e (t) peut être appelé erreur du filtre. 

Voici les contraintes auxquelles doit satisfaire le filtre (9): 
le vecteur fonction p ({) doit être une estimation non déplacée de 
z (t), et de plus, minimiser la variance de l'erreur (plus précisément, 
minimiser une certaine fonctionnelle qui dépend de la matrice de 
corrélation du processus aléatoire vectoriel e (t)). Le choix des 
matrices F (£) et G (t) ainsi que celui de l’état initial du filtre p (4) 
doivent être guidés par [ces contraintes. 

Cherchons d’abord l'équation différentielle vérifiée par le vecteur 
fonction e (t). D'après (11), (1), (9) et (6), on a 


= (A (D —F(E)—G (4) C(1z (+ 
+F(the(t)+B(t)w(t)—G(t)v(t). (28.12) 


Afin que le vecteur fonction p (f) soit une estimation non déplacée 
de zx (t), il faut observer la condition 


M [zx (t)] = M [p (t)] pour tout 1 >, (28.13) 

d'où l’on déduit d’après (11) 
M{e(t)}]=0 pour tout £4>+t0, (28.14) 
+ Me(GI=M[#]-0 pour tout £>fo. (28.15) 


En tenant compte du fait que d’après (2) et (7), M {w (t)] = 0, 
M [v (t)] = 0, et en remplaçant le premier et le second membre 
de l'équation (12) par leurs espérances mathématiques, on obtient 
en vertu de (14) et (15) la relation 


AO—F(D—G(bC(HIMiIx(t] = 0. (28.16) 


Comme M {x (1)] = 0, la condition (16) de l'estimation non déplacée 
de z(t) devient 


A(—F(b—G(DC(D = 0. (28.17) 


De cette façon, les matrices F (t) et G (t), qui font partie de l’équa- 
tion du filtre (9), doivent vérifier la relation 


Ft =A() —G(icC(i. (28.18) 
Conformément à (13) et (4), l’état initial du filtre p (4) doit être 


P (to) = %o- (28.19) 
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Si les conditions (18) et (19) sont remplies, le vecteur fonction p (t) 
est pour tout { > t, une estimation non déplacée de l’état x (1) 
du système initial (1). 

Ainsi le filtre fournissant l'estimation non déplacée de zx (t) 
est décrit par l’équation différentielle 


P=1A(D—G(HC(Ho+G(#)z(t); P(t)=Ze (28-20) 


Les filtres décrits par l'équation (20) comportent comme paramètre 
la matrice G (t). La matrice G (t) doit être choisie en se guidant par 
la condition de minimisation de la variance de l'erreur e (t). 

Indiquons maintenant le critère de performance du filtre. Remar- 
quons au préalable que puisque d’après (14) M [e (1)] = O0, la matrice 
de corrélation de l'erreur e (ft) est 


ES = Mle(t es (t)]. (28.21) 


La matrice (#) est symétrique. Sa valeur initiale Z (4,) s'écrit 
E (to) = M [e (to) €* (fo)] = 


=M {{z (to) —p (bo)] Lx (to) — P (to)]* } = _ 
= M {fx (to) — zol [x (to) — xol* }, 


Z (40) = Zoe (28.22) 


Comme nous l’avons dit plus haut, la matrice Z, est supposée connue. 
Considérons la fonctionnelle 


J=Mle* (T7) L(T)e(T)], (28.23) 


où T est l'instant fixé, et ZL (t) la matrice symétrique définie positive 
n X n. Puisque le produit scalaire a*b de deux vecteurs a et b de 
dimension » est égal à la trace de la matrice ba* detypen X n, c’est- 
a-dire à la somme des éléments diagonaux, 


a*b — Sp [ba*}), 
l'expression (23) peut s’écrire 
J = M {SpiL(T)e(T)e* (T)]l} = 


ou, d’après (5), 


= Sp {L(T)Mle(T)e* (7)}}, 
ou, en vertu de (21), 
J = SpiL (T) Z (7)]. (28.24) 


Adoptons comme mesure de la performance du filtre (20) la fonction- 
nelle (24). Dans l'équation différentielle (20) la matrice G (t) doit 
être choisie de façon à minimiser la fonctionnelle (24). Le filtre 
qui satisfait à cette condition s'appelle filtre optimal. 

Cherchons maintenant l'équation différentielle vérifiée 
par la matrice de corrélation Z (+). 
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L'équation différentielle (12) vérifiée par le vecteur fonction e (t) devient, 
en vertu de (17) et (18), 


_ —(A(#)—G(t)C(te(t)+B(t)w(t)—G(r(n. (28.25) 


Puisque d'après (21) 
Z(t)=Mle(t) e* (1)], 
il vient 
dE d 


= Me G=M [et ]+Mlet 


de* 
al 
ou, d'après (25), 
= [A(t)—G(t)C(t)]Mle(t)e* (4)]+M Le (tr) e° (8)11A (2) —G (4) C (2) + 
+B(t)M{w(t)e*(t)]+Mle(t)w(t)] B* (1) — 
—G(t)Miv(t)e*(4)]—Mle(t)v*(11G*(1. (28.26) 
En tenant compte de (21), l'équation (26) peut s’écrire 
= IA (6 (1) C (01 S (DZ (8) [A (D —6 (0 C EI + 
+B(t)Mlw(t)e*(t)]+Mle(e) w(t)] 8% (te) — 
—G(t)M{v(the*(t)]—Ml{e(t)c*(4]G*(. (28.27) 
Remarquons maintenant que d'après (2), (7), (14), 
M {w (t)] = 0, M{v(t)} = 0, M [e (t)] = 0. 
Conformément à (11) et à (19), 
e (to) = z (to) — Zo. (28.28) 


Puisqu’on suppose que v (1), w (t) et z (t,) sont indépendants (non corrélés), on 
en tire que 


M [e (to) w* (t)] = 0, M [e (to) v* (t)] = 0, 


M [w (t)e* (to)] = 0, Mlv(t)e* (to)] = 0. (28.29) 
Désignons maintenant par Ÿ (£#, t) la matricen Xn 
Vtt, T=x(t)x2 (1), (28.30) 


où x (t) est la matrice fondamentale des solutions de l’équation différentielle 
homogène 


D LA (0) —6 (1 C'(b)e (D. (28.31) 
La solution de l’équation différentielle (25) est de la forme 


t 
e(t)=®#(t, to)e (to) + | W(t, t)B(t)w(Tt) dt — 


t 
—\ W(t, t)G(t)u(r)dt. (28.32) 
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En vertu de (32), (29), (3) et (8), on a 
Mle(t)uw*(t)]= (Et, to) Me (to) w* (t)]+ 


t 
ee | Y{t, t)B(x)M{w(t)w*(t)] dt — 
to 


t 
- | WE, t)G(x) Mlv(x) w* (t)] dr = 


to 
t 
= | W(t, t)B(x)8(t—+) Q(t) dv = B (1) Q (0). (28.33) 
lo 
—Mle(t)o*(t)]=—Ÿ(t, to) Me (to) v* (t)] — 


t t 
— | W(t, t)B(t)Ml{w(t)v*(t)] dt + | Wt, t)G(t)Mv(t) v*(t)] di = 
t t 
0 , 0 
_ | W(t, T)G(T)ô((—TR(T) ar= +6 (t)R(t). (28.34) 
to 
D'une façon analogue 


Mlw(t)e*(t)] = + Q(t) B*(t), (28.35) 
—M{v(the* E=+ R(t)G* (+). (28.36) 


Les expressions (27), (33)-(36) et (22) font que la matrice Z (+) 
est définie par l'équation différentielle et la condition initiale 


D (ACDC (DIE + SIA (D —G (0 CN" + 
+ B()Q(+)B*(#)+G(E)R(#) G*(t), (6) = Zoe (28.31) 


Comme les matrices À (t), B (t), C (t), Q(t), R (t) et Z, sont don- 
nées, le paramètre dont dépend la solution Z (t) du problème de 
Cauchy (37) est la matrice G (£). Ainsi, la valeur de la fonction- 


lle (24 
Po J = SpIL (T) à (T)] 


dépend également de la matrice G ({) comme d’un paramètre. 

La matrice G (ft) qui minimise la fonctionnelle (24) est optimale, 
et le filtre (20) dont G (t) = G (t) est un filtre optimal. Dans l’ouvrage 
de base de Kalman et Bucy [37], le filtre optimal se construit à l’aide 
des méthodes de calcul fonctionnel. Dans ce qui suit nous donnons 
une autre méthode de résolution du problème [5]. 
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Si l'on considère l’ensemble des éléments o;; (i, j = 1, ne) 
de la a AN Z comme un état du système (37) et les éléments 
Lin G=1,...,n; k—=1,...,m) de la matrice G comme des 


commandes appliquées à ce système, on aboutit, comme l’a montré 
M. Athans 15], à l'un des problèmes déterministes de commande 
optimale qui consiste à choisir les commandes g,, (4) (Gj = 1, ..., n; 
k—1,...,m) (t) Lt LT) de façon à minimiser la fonctionnelle 
(24) ; de plus, dans ce problème le temps T est fixé et l’extrémité 
de la trajectoire est libre. Ce problème peut être résolu en appliquant 
le principe du maximum de Pontriaguine. 

D'une façon analogue à (24.5) la commande optimale G (t) doit 
minimiser la fonction 


5 ju py(o=Sp[SP°(], (28.38) 


i=1 j=1 


où par P(f) on désigne la matrice nr X nr dont les éléments 
Puy, j—=1,...,n) sont de même que dans (24.4) des variables 
auxiliaires du problème à à temps fixé et à extrémité libre de la trajec- 
toire. 

Conformément à (37), l'expression (38) peut être ramenée à la 
” forme 


Ge =Sp{[A(t)E(t) P*()]—Sp(G()C(t)Z(e) P° (+ 
+Sp{(2(1) 4° (4) P*()1—Sp[Z (6) C*(e) G° (6) P° ()1+ 
+Sp(B()Q()B*(G)P*()]+SpiIG(t) R()G°()P*()1. (28.39) 


Proposons-nous maintenant de déduire certaines relations auxiliaires dont 
nous aurons besoin dans ce qui suit. 

1) Considérons la matrice azbr*, où a est la matricen X n; b, la matrice 
m X m; x, la matrice n X m. Cherchons la trace de cette matrice Sp [azba*], ainsi 
que les dérivées partielles de Sp [azbzx®] par rapport à zy, ( —1,...,n; 
k = 1, ..., m), où zy, sont les éléments de la matrice z. 

Introduisons les notations 


c= at, d=bz*,e = cd. 
Les éléments des matrices c et 4 sont 
n 
Eyw= Ÿ GhlTIvs dyp= > byuTou (p=1,...,n; v=1,...,m). 
l=1 = 
D'où 


Mm . 
Epp — > Cpvdvp 
v=!i 
ou 


pp = 2 (2 hiZiv) (2 byuton) (0=1;.::;n): 
V= = = 


25—0393 


386 SYSTÈMES STOCHASTIQUES [CH. 6 


La trace de la matrice e—azbz* s'écrit 


Sp Lasbz*]= À ÿ (À suis) (Ÿ | bwuou) (28.40) 


eu v=!i 
L'expression (40) conduit à 


5 SP [axbz*] — S S TS S ajiZivbvr 


p=1 n=1 l=1 v=1 
(G=i,...sn;kæl,...,m). (28.41) 


La matrice rectangulaire nr X m dont les éléments sont 


0 : o 7 
nr ] G=1,...,n; k=—1,...,m), 


; Ô 
est notée 7 SP [axrbr*]. 
Désignons maintenant par qg la matrice nr X m 


a=7+6 (28.42) 
avec 
q—=a*rb, qg= axrb. (28.43) 
Les éléments des matrices nXm E—a*r et Ê—azx sont 
n n 
Eu = À GpFpns  Êjv= 2 ajiZlv- 


Les éléments des matrices n Xm get q sont 


m m 
jh = > Eju0hur jh = » Ejvbv 
u=1 væ!i 


ou 


m n nm nn 
4jh — > > GhjTpubhys {jh —= > > a jiTivbvR- (28.44) 


p=1 p=-1 v=1 l=1 
Conformément à (42) et (44), 


> à combat À à aprivbyn U=l,...,n; k=4,...,m). 
U=— l=1 v=1 
(28.45) 


jh — 


tA: 


Il résulte des expressions (41) et (45) que 
= 4j Ut sin =, sm): (28.46) 


Par suite, on a la relation 


_. Sp {erbr*]-- a*rb* + axb. (28.47) 
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2) Examinons maintenant la matrice m X m 
À =ez, 
où e est la matrice mXn; z, la matrice n X m. Puisque 


n m n 
1=1 p=1 1=1 
il vient 
Ô 
0x jR 


Splez]=er; (H=l;iasn; Et, :::; mm) 
Donc 


_ Sp{ez] = e*. (28.48) 


3 Soient maintenant h la matrice nXm ; x, la matrice nXm. Considé- 
rons la matrice nXn 

y—=hz*. 
Etant donné que 


m ñn m 
Yop= D} hotzpt, Splhr*] = D D hoitpts 
1=1 p=1 1=1 
on a 


ul 


GEST 
et par suite, 


Splhz*]=/h;r G=1,...,n; k=1,...,m), 


Splhr*]= h. (28.49} 


4) Etudions encore quelques identités. Soient c la matrice nXm et d 
la matrice m Xn. Désignons par @ et les matrices 


p= cd, = de. 


Comme 
m n m 
py= > Cjidiÿs SP [cd]= ÿ > Cjidij 
n m n 
vu= 2) dej,  Spldl=Y Ÿ cdi, 
J=1 [=1 =! 


on a l’identité 
Sp [cd] = Sp (del. (28.50) 


5) De façon analogue, soient E et & des matrices nr X m. Désignons par q 
et p les matrices 
g = EC*, p = GE. 


Comme 


SE 


TJJ — à Eybr SpI8c*] = | STISTS 


SE 


Ejibits 


itas Îas 
ï 


T 


Puy = D Guëju Sp ISE*] = 
1=1 . 


LU 


25% 
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on a l'identité suivante : 


Sp (80°) = Sp [66%]. (28.51) 
On trouve aisément à l’aide des formules (47)-(51) la matrice we 


de type nr X m et la matrice = de type nr X nr. En vertu de (38), 


= — P(# 2° (6) C°(E)— P* (HE (0 C° (+ 
+P(HG()R°(D+P°(DG()R(E, (28.52) 
2 À% (8) P(E)—C° (1) G*(#) P(E) + P(DA(9 —P (1)G(DC(#). (28.53) 


Les conditions nécessaires pour que les commandes gy (j = 1, ..., 
.….n k—=1AÂ,...,m) minimisent la fonction  s'écrivent 


age  . 
m0 (=... n; k=1,..., m). (28.54) 


Le système des relations scalaires (54) est équivalent à la relation 
matricielle 


0: (28.55) 
Conformément à (52), la condition (55) devient 
—P(#) E* (#) C* (6) — P° (1) E (8) C* (9 + 
+ P(DG(DR*(D + P*(DG(DR(D —=0. (28.56) 


D'après le principe du maximum de Pontriaguine, les 
variables auxiliaires pyy (à, j = 1, ..., n) vérifient le système 
d'équations différentielles | 


d où tu 
= 71 (,j=1, ...,n) (28.57) 


équivalent à l'équation différentielle matricielle 

dP 0 

& — = : (28.58) 
En raison de (53), l'équation (58) s'écrit 
= —P(HIAD—-G(HC()N—-1A—-G(HC(ENP(E). (28.59) 


Conformément à (24), dans notre problème les valeurs frontières 
de puy (T) (à, j = 1, ..., n) des variables auxiliaires sont, d'une 
façon analogue à (24.68), 


Py(T)= y SPIL(TIE(TN (ji, n), (28.60) 
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ce qu’on peut représenter en écriture matricielle 


P(T)= AT Sp[L(T)Z(T)]. (28.61) 
D'après (48) 
sm SP [L(T)Z(T)= L*(T). (28.62) 


Puisque L (T) est une matrice symétrique définie positive, il vient 
L (T) = L® (T) et, par conséquent, 


| P (T) = L(T). (28.63) 
Donc, la matrice P (T) de type rz X nr est symétrique définie posi- 
tive. 

En transposant les deux membres de l'équation (59);‘on obtient 


—— —P*(t)[A (t)=G (t) C(t)}]—[A(t)—6G (+) C(t)]" P* (t).5 (28.64) 


‘Etant donné que P (T) est une matrice symétrique, il vient, d'après (63), 
pour 1 condition aux limites Ù | 
P* (T) = L(T). (28.65) 
La Re re son de l’équation (59) et de la condition aux limites (63) avec 
l'équation (64) et La condition aux limites (65) montre que les équations diffé- 
rentielles et les conditions aux limites vérifiés par P (t) et P* (1) coïncident; 
par suite, en raison du théorème d’unicité, Re 


P (t) = P* (t), (28.66) 


c'est-à-dire P (t) est une matrice symétrique. Montrons encore que P (+) est une 
matrice définie positive. En désignant par A,(t) et A2 (t) les matrices n Xn 


A1 (9) = —[4 (6) — G (+) C (b]°, 


Aa) = —IA (9 — G (9 C (© (20:07) 
l'équation matricielle (59) se ramène à la forme 
TT (#) P (t)+P (t) À: (+). (28.68) 


Soit M, (t, to) la matrice n X n qui vérifie l'équation différentielle matricielle 
d 
7 Mat, to)= Ait) Male, to), tElto, TJ, Mitos to)=E. (28.69) 


Supposons que les éléments de la matrice 4, (t), et, par suite, ceux de la matrice 
A3 (t) soient des fonctions bornées, continues par morceaux sur l'intervalle 
[to 7]. Alors, comme on le sait, la solution de l'équation (69) peut se mettre 
sous la forme d’un matrizant [17], c'est-à-dire sous celle d’une série absolument 
et uniformément convergente 


Mt, to) = E+TAI+TAITAI+TATA As +... 
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où 
t t ‘ T1 
l'A = | Ai(t)dtu, TA Ai - | À; (Ti) | Ai (Ta) dte dti, 
to lo to 


{ T1! Ta 
AT AIT A; = | Ai (ti) | Ai (x) | As (x) dts de dti, 
to to to 


Le matrizant Mit, to) jouit de la propriété [17] 


t 
det Mu(t, to) =exp | Sp A1 (t) dx (28.70) 
lo 
et donc c’est une matrice régulière. 


Désignons + Ma (t, to) la matrice n X n qui vérifie l'équation différen- 
tielle matricielle 


TM: (t, to) = AS (t) M: (4, to)» tElto, T}, M (to; to) = E. (28.71) 


D'une façon analogue à (70), 
t 
det Ma (t, to) = exp | Sp A? (xt) dt, (28.72) 
to 


c'est-à-dire la matrice M, (t, t,) est une matrice régulière. 
. L'équation différentielle (68) a comme solution: 


P(#) = Mit, to) P (to) Mat, to)3  tElto, TI, (28-73) 
dont la validité se vérifie par simple substitution. (73) entraîne que 
P(T)= Mi(T, to) P (to) M3 (Ts to): (28.74) 


Puisque d’après (63) P (T)=L (T), c'est-à-dire puisque P (T) est une matrice 
symétrique définie positive, il vient 


det P(T) Æ 0, 
et, en vertu de (70) et (72), la relation (74) implique que 
det P (ts) Æ 0. 
Il résulte alors de la relation (73) que 
det P (t) Æ 0, tElto 7]. (28.75) 


Comme d'après (67) A%(t) = A, (t), en vertu des équations (69)et (71), 
Ma (ts to) = Mit, te) et l'expression (73) devient 


P(t) = Mitt, to) P (to) M? (ti to), tEltn TI (28.76) 


Les expressions (76), de et (66) entraînent que la matrice P (t),t€[to, T|, 
qui vérifie l'équation différentielle (59) et la condition aux limites (63), est sy- 
métrique définie positive. 
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En retenant que P (ft), Z (t) et R (t) sont des matrices symé- 
triques, la condition nécessaire (56) minimisant la fonction G£ peut 
se mettre sous la forme 


P(DI—-Z2 OC (D +G(ODR(] = 0. (28.77) 
Comme d’après (75) P (t) est une matrice régulière, larelation (77) 
ne peut avoir lieu que si l’on observe la condition 
—2 (D C* (D +G(DR(E = 0. (28.78) 
L’équation matricielle (78), où l'’inconnue est la matrice G (t), 
possède une solution unique 
G(t = 2 (D) C*(t) R-1 (0). (28.79) 


La matrice G (t) définie par l'expression (79) constitue précisé- 
ment la commande optimale minimisant la fonctionnelle (24). 

En remplaçant dans l’équation différentielle (37) G (t) par sa 
valeur tirée de (79) on ramène cette équation à la forme 


À = A(D2+ ZA" (1 — 2C° (0 R1(#)C (0) E + B (0) Q(E) B* (0). (28.80) 
Z (to) = 20. (28.81) 


Dans ses ouvrages (34, 35], Kalman a montré que si ©, est 
une matrice définie non négative, l'équation (80) possède une seule 
solution qui existe pour tout £ > 4. 

D’après (20) et (79), l'équation différentielle du filtre optimal est 


PB 21423 (DC (OR COIP+ 


HEC" (DR (Dz(),  P(t)=20 (28-82) 


où © (t) est la solution de l’équation différentielle de Riccati (80) 
qui vérifie la condition initiale (81). 

La solution p (f) (t9 Lt L T) de l'équation différentielle (82) 
est une estimation optimale non déplacée de l'état x (t) du systè- 
me (I). 

Faisons encore la remarque suivante. L'équation (82) peut se 
mettre sous la forme 


D A()p+E (DC RA(DIZ—-C (Pl,  P(t)== 70, (28-83) 
où, d’après (6) et (11), 
24) —C()p =C(lz() — pl +v( =C(Hbe() + v(. 
(28.84) 
Ainsi, le filtre optimal est un système à retour dont l'entrée 


est définie par la fonction C (ét) e (t) dépendant de l'écart et par la 
perturbation additive du type de bruit blanc v (t). 
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L'équation différentielle (80) et l'expression (79) montrent que 
les matrices Z (t) et G (t) ne dépendent pas de la valeur de T interve- 
nant dans la fonctionnelle (23) de l'extrémité de l'intervalle de temps 
d'observation [f,, T1. La valeur de T ne détermine que la matrice 
P (t) définie par l’équation différentielle (59) et la condition aux 
limites (63). Mais pour définir la matrice G (£) à partir de la condi- 
tion (56) nous n'avions appliqué que la propriété de symétrie et de 
non-dégénérescence de cette matrice P (ft). Ceci permet de conclure 
que le filtre optimal (82) donne une estimation optimale non déplacée 
uniforme par rapport à t de l’état x (4) du système (1). 

Il s'ensuit de (79), (80) et (81) que le filtre optimal ne dépend 
pas de la forme concrète de la matrice L (7). Toutefois, l'hypothèse 
suivant laquelle cette dernière est symétrique définie positive est 
d’un grand intérêt, puisque ce n'est que dans ces conditions, comme 
le montrent (63), (74) et (76), que la matrice P (t) est définie positive. 
L'expression (79) de la matrice G s'obtient à partir de la condition 
0%€/0G = 0; elle définit la valeur extrémale unique dela fonction &. 
La matrice symétrique d*%£/0G* de type rz=m X nm et dont les élé- 
ments sont les dérivées partielles 00108 n08: ri dl SU, 
k, L = 1, ..., m) peut être mise sous la forme d’une matrice par- 
titionnée symétrique S de type m X m, dont les éléments s,, sont 
de la forme s,, = 2P (t) r,, (4), où r,, sont les éléments de la matri- 
ce À. On peut montrer que la matrice d°%%#/dG*? ne sera définie positive 
que dans le cas où P (t) est une matrice définie positive. | 


La démonstration de cette proposition appartient à A. Formalski. Soit 
& (t) la matrice n X n vérifiant la condition =* (+) P (t)= (t) = £, où E est 
la matrice unité nr X n. Il vient 


srses D Pr4 Prin ss 0 ” EËryu ... Erim — 


[Q . 


Dis g Prm1 ... Prmm 0... _ 
En désignant par N la matrice m X m qui vérifie la condition N°RN = E, 
où E est la matrice unité m X m,ona 


 Ényi … Enm: E n Êru …. Érim | " ÊËny: … Enim 
Ode ue ve Le Gr X Ji tn, der à X OR SLR LS — 
Enim Enmm Ermi Érmm Enm: Enmm… 
TE ...0 
0... E 


ce qui prouve notre proposition. 


On voit de ce qui précède que pour la valeur (79) de la matrice G 
la fonction €? ne possède de minimum que sous la condition d’une 
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matrice P (ft) définie positive. Ainsi, la matrice G définie par l’ex- 
pression (79) minimise la fonction &#£ et, par conséquent, ne vérifie 
les conditions d'optimalité nécessaires pour les fonctionnelles de la 
forme (23) qu’à la condition que Z (T) soit une matrice définie 
positive. 

Notons que la commande (79) vérifie non seulement les conditions 
nécessaires d’optimalité mais encore les conditions suffisantes d'opti- 
malité, ce que l’on peut montrer, de même qu’au $ 24, en examinant 
pour le problème donné l'équation de Bellman analogue à l’équa- 
tion (24.46). 

Montrons d'une façon analogue à (24.42) comment, sous la condition ini- 
tiale (81), la matrice Z (f), qui est la solution de l’équation différentielle de 


Riccati (80), peut être exprimée à l’aide de la matrice fondamentale des solu- 
tions du système d'équations différentielles linéaires vectorielles 


ne — 4e (9) EC (E) R-1(0) C (Ep, 
a (28.85) 
= B(t)Q(1) B*()E+A(:) p, | 
où & (t) et p (rt) sont les vecteurs de dimension n. 

On voit sans peine que (85) entraîne la relation 


pu (t) = Z (+) E (+), (28.86) 


où 2 @ est la solution de l’équation de Riccati (80). En effet, conformément 
à (86), la deuxième équation (85) se met sous la forme 


À 81) +2 (0) mm B (4) Q (6) B“()E()HA() Z(E(). (28.87) 
En portant dans l’équation (87) au lieu de le second membre de la première 
équation (85) et en tenant compte de (86), on obtient 
[S —A (+) 2 ()— 5 (8) A (e)+ 2 (8) C® (1) R-1 (8) C (+) Z (4) — 


—B(HQ(DB°()]E(D=0. (28.88) 


La relation (88) est identiquement vérifiée en vertu de l'équation différentielle 
de Riccati (80), qui définit la matrice Z (4). C'est ce qui justifie la relation (86). 

_ Désignons par g (t) la matrice fondamentale des solutions du système d'équa- 
tions différentielles vectorielles (85) et par Il (4, t0), la matrice 2n X 2n 


IL (4, to) = g (t) 8? (to). L (28.89) 
La solution du système d'équations vectorielles (85) s'écrit 

64) 1 6 (to) 

4 wi = I (4, to) ls (04 (28.90) 


En faisant figurer la matrice I (!, t,) de type 2n X 2n sous la forme d’une ma- 
trice partitionnée dont les éléments sont les matrices ñn X n. 
[I (4, to)= pe (t, to) Ie (t, to) 


Toi (t, to) Iles (t, to) ” (28.91) 
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on obtient à partir de (90) les relations 


8 (4) = I (és to) 8 (to) + Tlis (tr to) H (£o);, 
u (t) = Tu (4, to) Ë (to) + Tss (t, to) u (to): 
Puisque d'après (86) et (81), 
U (to) = Zoë (to); (28.93) 
on a, en vertu de (86) et (92), 
E (4) La (6, to) + ua (6, to) Zol = [an (ts to) + as (t, to)] Zor (28-94) 
d'où l’on tire que 
E (4) = [ls (4 te) + Mas (ts to) Zol [ua (ts to) + Mis (£, to) Zol”?. (28.95) 
Considérons encore quelques propriétés du processus aléatoire 


d'innovation 
4 () = 2 (4) — C (t) p (b) (28.96) 
qui fait partie de l'équation différentielle (83) du filtre optimal. 
D'après (10), (11) et (6), l'expression (96) peut s’écrire 
LD =CHOIzt—z(D+v(D =C(De(+vt(t). (28.97) 
Conformément à (14) et (7), 

M [4 (0)] = 0, (28.98) 
et donc y (£) est un processus aléatoire gaussien à moyenne nulle. 
Cherchons la matrice de corrélation de x (t). D'après (97), 

M [4 (0) x* (no) = M {IC (de (8) + v (OI TC (x) e (x) + v (IS } — 
= C( Mle(tie* (rx)]C* (x) +C( M Le (8) v* (x)]l + 


(28.92) 


+ Mlv(de* ()lC* (x) + M Iv (6) v* (x)]. (28.99) 
Introduisons la notation 
G (t, 7) = Mle(t)e* (x)]. (28.100) 


Puisque (25) conduit à 
t 
et) =Y(, e(m+ Y(t,s)B(s)w(s)ds— 


T 


— | W(t,s)G(s)v(s)ds, (28.104) 


Et, T)=VY(t, T)M{e(rhe* (t)] + | Wt,s)B(s)M{w(s) e* (t)] ds — 


_ | W(t,s)G(s)M{v(s)e*(t]ds. (28.102) 


T 
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Comme pour s> 7, 
M [w (s) e* (x)] = 0, M [v (s) e* (x)] = 0, (28.103) 
l'expression (102) devient conformément à (21) 
Gt, T)=Y(t, +) E (x). (28.104) 
D'une façon analogue à (102), 
Mle()o" (= Ÿ(4, t)M le (t)v"{x)] + 


1 
+ ['Y( s) B(s)Miw(s)v* (x) ds— 


t 
— | W(t.s)G(s)M{v(s)v*(t)]ds.  ( 8.105) 


D'après (36) et (79), 
Ml{e(t)v*(r)] = —+G()R(r)= —+2(r)C* (t). (28.106) 
En vertu de (8) et (79), 


| W(t,s)G(s)Mv(s)v* (T)] ds = 


= Y(, TG (TR (= ST Y( 7) E (7) C*(r). (28.107) 


Les processus aléatoires w (t) et v (?) ne sont pas corrélés, et donc, 
M [w (s) v* (x)] = 0. (28.108) 


. résulte de (106), (107) et (108) que l’expression (105) se met sous 
a forme 
Mle(t)e* (t)] = —Y (4, +) Z (x) C* (x). (28.109) 
Le troisième terme de (99) s’annule du fait qu'avec {1 > + 
M [v (t) e* (t)] = 0. (28.110) 
Ainsi, d’après (104), (100), (109) et (110), l’expression (99) s'écrit 
M {x (0 x* (= CO (E +) Z (x) C* (7) — 
— CET, Tr) 2 (7) C® (Tr) + 
+ Mu (td) vf (x)] = M [v (4) v* (x)|, (28.111) 
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et, par suite, on a avec (8) 
M [x (#) x° (x) = R (4) Ô (t — +), (28.112) 


c'est-à-dire le processus aléatoire x (t) est un bruit blanc de même 
matrice de corrélation que le processus aléatoire v (t) intervenant 
additivement dans le signal observé (6). 


$ 29. Théorie globale du filtrage 


1. Estimation non déplacée à variance minimale de l'erreur. 
Considérons le système décrit par l'équation différentielle vectorielle 


= — A(t)z, (29.1) 


où x est le vecteur de dimension 7 ; À (t), la matrice r7 X nr. Introdui- 
sons les notations 
O (t, t)—0 (1) 0-1 (x), (29.2) 


où 0 (t) est la matrice fondamentale des solutions de l'équation (1). 
La solution de l’équation (1) est 


z (t) = 6 (4) 8-1 (4) x (to). (29.3) 
Soit 4€ [t»o, TJ. D'une façon analogue à (3), on peut écrire que 
z(T)=0(7)0-1(#4) x (t). (29.4) 


En multipliant les deux membres de la relation (4) à gauche par la 
matrice 0 (4) 8-1? (T), on obtient 


8(1 8 (T)z(T) = 0 (1) 87° (T) 8 (T) 8 (+) z (4) 


ou 


z(h =60()08-1(T)z(T). (29.5) 
En récrivant l'expression (5), on a 
z( =O(t, T)z(T). (29.6) 


Supposons que sur l'intervalle {, < t < T on mesure les valeurs 
du vecteur fonction z (t) de dimension m défini par la formule 


z2()=C(Oz(b+v(, (29.7) 


où v (t) est un processus aléatoire à moyenne nulle. Sa matrice de 
corrélation est 


Mlv(t)v* (t)]=R(t) ô (t— 7), (29.8) 


où R(t) est une matrice symétrique définie positive. 
L'expression (7) peut s’écrire 


2()=CHO(E, T)z(T)+v(t), LH KIT. (29.9) 


Ici x(T) est un état fixé mais inconnu du système. 
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On demande de trouver la meilleure estimation de cet état. 
Considérons d’abord le problème d'estimation de la variable scalaire 


Q = p*x (T), (29.10) 


où p est le vecteur de dimension n arbitraire mais connu. Désignons 
par ( l'estimation de @. En général, Q est une variable aléatoire 
du fait qu’elle se détermine d’après la fonction z (t) fournie par 
l'observation et intervenant additivement dans la fonction aléa- 
toire v (f). k 
Exigeons : 1) que l'estimation Q soit non déplacée, c'est-à-dire 
que la condition 
M 1{Q] = p*z(T)=Q (29.11) 


soit remplie ; 2) que la variance de l'erreur d'estimation soit mini- 
misée 
M [(Q — Q})°] = min. (29.12) 


Définition. Le système (9) s'appelle complètement obser- 
vable si pour tout t, il existe une valeur T(t,) telle que pour un certain 
paramètre Q, défini par l'expression (10), on peut trouver une esti- 
mation linéaire non déplacée Q qui serait une fonctionnelle fournie 
par l'observation z(t) dans l'intervalle de temps t,<t <T. 

Appelons estimation linéaire ( l'estimation 

T 
@ — | s*(#)z(t) dt, (29.13) 
to 
où s(t) est un vecteur fonction de t de dimension m (peut-être, 
continu par morceaux). 

Constatons qu'il se peut que le système (9) soit complètement 
observable pour certains vecteurs p, mais non pour tous. 

Théorèmeïi (sur l’'observabilité en pré- 
sence des perturbations aléatoires). Le système 
(9) est complètement observable si et seulement si la matrice symétri- 
qunxn 


T 
M (to, T) = | D°(t, T)C*(H)R(HC()OD(, Thdt (29.14) 
A 


est définie positive pour un certain T > to. 
Démonstration. 1°. Si # (t,, T) est une matrice définie 
positive, il existe une inverse #”? (t%, T). En posant 


sÜ=s(t=R1HDCHO(E, T)oAH1 (to, T) p, 
LIT (29.15) 
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cherchons conformément à (13) l’estimation linéaire de la variable 
scalaire Q = p*z (T): 


T 
Q = pro "1 (to, T) | D*(t, T)C*(t)R-t(t)z(é)dt. (29.16) 
to 


Puisque M [v (t)] = 0, d’après (9) 
Mlz(1=M{(C()O(, T)z(T)+v (t)] — 
| =C(DOD(,, T)z(T) (29.17) 
et, en vertu de (16), (14) et (10), 
T 


M{Ô] = p'e#=! (to T) | D"(t, T)C* (D RAD C(H)O(t, T)dtz(T)= 
i = p°xz(T)=Q. (29.18) 


Ainsi, la condition (11) d'estimation non déplacée est respectée. 

2°. Supposons que le système (9) soit complètement observable 
mais «# (t,, T) soit une matrice singulière. Il existe alors un vecteur 
p 0 tel que la forme quadratique 


(p, # (to, T) p) = 0. (29.19) 


CH =C(HO(,E, T)p,tEléo, T]. : (29.20) 


(19) et (9) entraînent que la fonction & (t) coïncide identiquement 
avec la fonction z (t) sur l'intervalle [f,, T] dans le cas où z (T) = p, 
et v(t) =0 pour tE[t,, TI. 

Puisque d'après (19) 


Soit 


T 
Je @) RE à = 
to 


T 
= p* | O*(t, T)C*() R1(H)C(DO(t, T)dtp= 
to 


— p*o#{ (to, T) p={pP: M (to, T)p)=0 (29.21) 

et R-1(t) est une matrice définie positive, il résulte de (21) que 

t (= 0 pour 1E[t,, T]. (29.22) 

Supposons maintenant que s (t) détermine selon (13) l'estimation 

non déplacée de la variable scalaire Q = p*zx (T). Pour z (T) = p 
et v() =0,4€Elt, T}, d'après (13), (20), (22) et (11), on a 

T T 
O0 — \e (4) S (€) dt — E (t)CEO(E,T) dtp—Q—Q=(p,p}. (29.23) 


lo to 
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La relation obtenue contredit.l'hypothèse initiale suivant laquelle 
p 0. Cette réduction à l’absurde résulte de l'hypothèse que dans 
un système complètement observable la matrice æ# (f,, T) puisse 
être singulière. Par suite, si le système (9) est complètement obser- 
vable, la matrice «# (t,, T) est une matrice régulière. Etant donné 
que c# (to, T) est une matrice de Gram et que det «# (to, T) Æ 0, 
cette matrice est définie positive. Le théorème est démontré. 


Cherchons maintenant l'équation différentielle vérifiée par la 
matrice c# (to, T). 
Notons d’abord que puisque 
60-1(T7)8(T)—E, 
où E est la'matrice unité, il vient 
d6-1 -, dO 
ar 0+0" 70, 
d’où l'on tire que 
d0-! _, d8 
7 = —06 270 1. (29.24) 


Comme 6 (£) est la matrice fondamentale de l’équation différentiel- 
le (1), on a 
40 (T 
= A(T)O(T). 
L'expression (24) devient ainsi 


dOr1(T . 
= 0 1(T)A(T). 


Il s'ensuit que 
7 D (e, T)=-x (0 ()0"1(7))— —0(1 0": (T) A(T)— 


= —O(,T)A(T), x D°( T)=—ANT)D"(t, T). (29.25) 


En dérivant les deux membres de la relation (14), on obtient 
conformément à (25) l'équation différentielle vérifiée par la matrice 


fl (to T) 
dcfl 
ZT = — A°(T)MH—HA(T)+C*(T)R1(T)C(T). (29.26) 
D'une façon analogue à (24) 
deÂl”1 | dl ,,_ 
7 = — À 1 ir A LL (29.27) 


D'après (26) et (27), l'équation différentielle vérifiée par la 
matrice «#”!(£,, T) est 


= A (T) NH A® (T)— NC (T) RA(T)C(T) HT 
9.28 
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L'équation (28) coïncide avec l’équation différentielle associée 
à la matrice Z, composée à partir de l'équation de Riccati (41.80) 
avec Q (t) = 0. Ainsi, la matrice +# -! est analogue à la matrice ZX. 
On voit facilement que la matrice c<#-! (f,, T) est une matrice 


de corrélation de l'erreur d'estimation linéaire non déplacée zx (7) 
qui s'écrit d’une façon analogue à (16) 


T 
2(T)= 4" (to T) | D®(t, T)C®(#) R-1(t)z(t)dt. (29.29) 
to 


En effet, d’après (17), 
M(:(]=C(®D(, T)z(T) 
et donc 
M{z(T)]= ; 
= of" (to, T) { (4. T)C* (D R1 (DC (D O(, T)dtz(T)=z(T). 
b (29.30) 


Comme (29), (9) et (30) conduisent à 
z(T)— 2 (T)= "1 (t0, T) [ o (, T)C°(t) R'!(t)v(t) dt, (29.31) 
il vient ° 
M{{z(T)—2(T)z(T)—z(T)"}= 
= M{o#h-t (to, T) (o (t, T)C*(t) R(t)u(t)dt x 


T 
X | v'(tT)R 1 (T)C(T)OD (x, T)drA 1 (to, T)} = 
È TT 
= A-i(t, T) ( @*(t, T)C*({)R=(t) x 
o to 

XM{v(t)v*(t)]R=t(T)C(T)O(t, T)dtdtM”1(t5, T). (29.32) 
D'après (8) 

M [v (t)o* (x)] = R (t) Ô (t — 7) 
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et l'expression (32) devient 
M{{z(T)—z(T){z(T)—z(T)"}= 


T 
= H#° (to, T) { D*(t, T)C*(t) RH) C()O(t, T)dteH- (to, T) = 
to 


=o#{"1(t;, T), (29.33) 
ce qui confirme la proposition énoncée dans ce qui précède. 
Dans le cas où v (t) est un processus aléatoire gaussien, la matrice 
c{ (to, T) coïncide avec la matrice d’information de Fischer. 
Théorème 2. Supposons que le système (9) soit complètement 
observable. Soit v(t) un bruit blanc à moyenne nulle (non forcément 
gaussien) et à matrice de corrélation M [v (t) v* (x)] = R (t) ô (t — +), 
où R (t) est la matrice symétrique définie positive. Dans ce cas l'esti- 
mation linéaire non déplacée à variance minimale de l'erreur, pour 
toute valeur scalaire Q = p*zx (T) est Q = p*zx (T), où zx (T) est déter- 
minée par la relation (29): 


T 
2(T)= A1 (to, T) | D (4, T)C® (4) R1(t)z (6) dt. 
to 


Démonstration. 1°, Comme nous dre pe plus 
haut (30), MIz(7T)] = zx(T). Par conséquent, M [Ô] — 

2°. Soit o l'estimation linéaire non déplacée de la RL sca- 
laire Q = p*z (T) déterminée par la relation 


T 
o— | r* (t)z(t) dt. (29.34) 
lo 
Conformément à (9) l'expression (34) peut s'écrire 
T 
5 = { (IC (D O(L, T)z(T)+v(tldt. (29.35) 
lo 
Puisque 
M [v (t)] = 0, 
on tire de (35) que 
T 
M{0]=— | r"()C()O(t, T)z(T)dt. (29.36) 


to 
Il s'ensuit de (35) et (36) que l’erreur d'estimation 
T 
e=0—M{0o]— | r* (t)u(t) dt. (29.37) 
to 
20—0393 
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On tire de (37) que 


T T 
= | {r(t), v(t))dt (œ(n. r (t)) dr = 
to 10 


TT 
== { | r*(thu(t)v* (t)r(r)dr dt. (29.38) 
to 


En vertu de (38) on a la variance de l'erreur d'estimation 
TT 
M{e]= | Ve ()M{v(t)v" (tlr(r) dt dt — 


to to 


TT 
| Îr° () R(D'8(— Tr (x) dr dt = 


to to 


T T 
- { r*(t) R(t}r(t) dt = | rt), R(t)r(t)) dt. (29.39) 
to to 


Si l’on tient compte de l'identité 
re Rr={S*+ (rt) RIS+(r—5)]= 
—24(r, Rs)—(s, Rs)+(r—s)"R (r—s), 


l'expression (39) se met sous la forme 


T T 
M{e°] = 2 er (t), R(S()) dt | S(), R(E)S(t))dt+ 


T 


ES Î [r (G)—s (IR (tr (—S(#)1dt. (29.40) 


to 


Considérons maintenant certains calculs auxiliaires. D’après (15) et (14), 


T T 
Î Se (4) R (e) 5 (t) dt = pofl=1 (to, n) | ©* (1, T)C®(#) R-1(1)X 
to to 


XC(DO(E, T) dtof”1 (toe T) p= paf" 1 (to, T) p=(p, #1 (to, T)p). (29.41) 


Comme o est une estimation linéaire non déplacée, on a d'après (36) 


T 
M[0]= | r* (1) CE) © (1, T)r(T)-dt= ptz (T). (29.42) 


to 
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La relation (42) a lieu pour tout vecteur z(T). C'est pourquoi (42) 
entraîne que 
T 


| r* (1) C(t)O(t, T) dt= p*. (29.43) 
to 
Il résulte de (15) et (43) que 


T 
| r* ()R(L)S(t) at | re (DC (D) O(t, Thoft-1(to, T) p dt = 
to 
= ptofl”1 (to, T) p=(p, cfl”t (to, T) pr. (29.44) 
Cherchons maintenant la variance de l'erreur d'estimation non déplacée 
@ = p*z (T) de la variable scalaire Q = p*zx (T). Puisque M{Q]=Q, ona 
| Q—MIQ=Q—Q= p*{2(T)—z(T)] = p*v, 
où 
v=2(T)—2z(T). 
Il en résulte que 
M {p*v (p*v)*] = M [p*vv*p]l = p*M [vv* lp. 
Puisque d’après (33) 
M [vv*] = of” (t,, T), 
on a 
M ((Q — Qÿ] = p'tit, T)p= (p, Hit, T)p). (29.45) 


D'après (44) et (41), l'expression (40) se met sous laï forme 
T 
M{e2]= (p, #72 (to T) p)+ (Ir (0) —S (DIR ()tr (0 —$(01dt, (29.46) 


to 
et donc 


M{e*12(p, #7 (to, T) p); (29.47) 


de plus, l'égalité n'a lieu que pour r(f)=s(t), 1€ [éo, 7], c'est-à- 
dire pour o = @. 
p En tenant compte de (37) et (45), on peut récrire la relation (47) 


M {lo — M (o)l} > M [(@ — Q)°]; 


de plus, l'égalité n’a lieu que pour & = Q. Le théorème est démontré. 
Théorème 3. L'estimation non déplacée x (T) à variance 
minimale de l'erreur, définie par la relation (29) 


T 
2 (T)= 43 (to, T) | ©*(, T)C° (OR (2 (dt 


26° 
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est l'état à l'instant t — T du système décrit par l'équation différentielle 
vectorielle 


= ADI+R(DIz(—C (DE, (29.48) 

où 
K (4) = #71 (to, t) C*(#) R71 (+). (29.49) 
Démonstration. Désignons par & (t, t) la matrice 
SC (t, t) = 8 (1) 01 (x), (29.50) 


où Ÿ(£) est la matrice fondamentale des solutions de l’équation 
différentielle 


_ LA()—oN"1(t,to)C*(t)R71(H)C (tx (29.51) 


construite à partir de l'équation (48) pour z({)=0. Montrons 
d’abord que 
HAT, D = A its T) O% (4, T) of (to, b, 

LELI<ET. (29.52) 
À cet effet remarquons qu'en vertu de l'équation différentielle (51), 
LH (Ti t)=— ST (Ts 1) 1A()— 04" (to, 1) C* (0) R71 (4) C (1)]. (29.53) 


D'autre part, en dérivant par rapport à { le second membre de l’ex- 
pression (52), on obtient 


À HAT, 1)= — A7 (to, T) D (ts T) 4 (to t) A (9) — 
— Mt, t)C"() R1(HC (HI. (29.54) 


En comparant les expressions (53) et (54), on voit aisément que la 
relation (92) est vraie. 
Si l’on prend en considération l'inégalité (47) obtenue dans ce 
qui précède, pour démontrer le théorème il suffit de prouver 
1° que 


T 
Z(T)= { ST (T, t) À (t)z(t) dt (29.55) 
to 


est une estimation non déplacée de l'état du système zx(T), et 
2° que la variance de l'erreur d'estimation vaut #”1(4,, T). 
En portant dans (55) l'expression (9) pour z (£), on a 


{ | 
MÉ(T)]= ET )R(HC()O(, T)dtr(T). (29.56) 
to 
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D'après (49), 


T 
| HT, DR (HC(DO(, T)dt= 
to 


A (T,t)A# 1, t)C*() RDC (D O(E, T) dt — 


T 
= M1 (to, T) { D (,T)o4 (tort) #7! (tort) C* () R1 (DC (D D(E, T) dt = 
to 


T 
= A! (to, T) | D, T)C*()R1(HC(HO(, Tidt=E, (29.57) 
to 


où E est la matrice unité. 
Ainsi, la relation (56) devient 


MIz(T=z(T), (29.58) 


c'est-à-dire que la première proposition demandée est démontrée. 
Cherchons maintenant la variance de l'erreur 


M{{z(T)— 2 (TZ (T)— x (T)}= 


=M{ H(T,1)K(tv(0 af A) (T,r)à}— 
to to 


TT 
— | | SC (T, 1) K (4) M{v(t)v* (x)] K* (t) Z*(T,T)dtdt. (29.59) 
to to 
Puisque 
M {c (&) 0% (t)] = R (t) Ô (t — +), 
la relation (59) se met sous la forme 


M{(z(T)—2x (TZ (T)—2z(T)}"}= 


= | AT, R()R()K* (D Z*(T, t)dt=- 


T 
— A1 (to, T) { (4, T)C* (1) R (DC (D O(t, T)dtH 1 (to T)= 
° — AH71(to, T) (29.60) 


et donc la deuxième proposition demandée est également prouvée, 
Le théorème est ainsi démontré. 
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Exemple. Considérons le système régi par les équations différentielles 


{ 
HR =% 
. (29.61) 
dt —_ ‘1 


Le système d'équations différentielles scalaires (61) peut être remplacé par 
l'équation vectorielle 


d 
_. = A(t)s. (29.62) 
avec 
1). 4041 0: 29.63 
[7 |. O=| _410]- (29.63) 


La matrice fondamentale des solutions de (62) est 


TOP cost sint (29.64) 


l —gint cost” 


La matrice inverse 0-1 (T) s'écrit 


cos T —sinT 
ae [in T  cosT}J' (29.65) 


D'apres (64) et (65), 


(4, n=0(et(n=| Ur nn À (29.66) 


En admettant que dans l'exemple concerné 


C(t)=[{[1 O|, ( 9 67) 
C(t)®@(t, T) = [cos (t — T) sin(t— T)]. (29.68) 


on obtient 


D'après (9), Le signal observé z (t) est une fonction scalaire définie par l'expres- 
sion 


z(=cos(t— T)a(T)+sin(t—T)z(T)+v(t, t<t<T, (29.69) 
où v(t) est un processus aléatoire unidimensionnel du type bruit blanc à moyenne 
nulle et à fonction de corrélation 
M{v(t)v(l=R(t)ô(t— 7). 
Adoptons pour notre exemple que 
R (t) = r = const, (29.70) 


où r est une grandeur positive. 
D'après (14), la matrice c# (t, T) est dans notre exemple 


1 F2(T—to)+sin 2(T—to)  —1+cos2(T—t0) A 
4r [ ee 2 (T — to) 2 (T —to) —sin 2 (T — to) ] . (29.71) 
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L'inverse c#Æ"1 (to, T) s'écrit 


ai-1 (to, T)= 
rI2(T—t0)—sin 2(T—to)] r[1— cos 2 (T —to)l 
(T — to) —sin* (T —to) (T — 10)" —sin® (T — to) 
| r[1—cos2(T —t0)] r[2(T—t0) +sin 2(T —t0)] | ° (29.72) 
(T—t0)®—sins (T —to) (T—t0)?-- sin? (T7 --t0) 


Le vecteur fonction À (4), gain de l'organe (48) prévu pour assurer l'estimation 
optimale, s'écrit d'après (49) 


: 2(t—to)—sin 2(t—to) 
5 K; (t) (t— to) — sin? (t— to) 
K (t)= = LIST. 
” Fe | sing) |" <EST (9.78) 
(£— to)? — sin? (t— to) 
Constatons que (73) entraine Vue K1 (t) = ©, es Ka (t) = ©. Pour t = t* = 
to to 
tx, on a; conformément à (73), K(#) = ©, À; (1°) = 0. 


2. Stabilité des filtres optimaux de Kalman-Bucy. Nous avons 
étudié ci-dessus le système 


= A(Dz+B(Dw (0, 
z ()=C(t)z(t)}+v(t). 


Ici w (t) et v(t) sont des processus aléatoires à moyennes nulles 
et à fonctions de corrélation 


M {w (t) w* (1)] = Q (Hô (t— 7), 
Mbv(bu*(nl=R(Dô(G— Tr), 


où Q(t) et R (t) sont des matrices symétriques définies positives. 
Considérons avec le système (74) le système 


= — A (t)z+C*(t) w(t), 
z(t)=B*(t)z (t)+v(), 


où w (t) et v (t) sont des processus aléatoires à moyennes nulles et 
À matrices de corrélation 


M (& (tv (x)] = Q-1 (0 6 (t — r), 
M {w (4) w* (x)] = R-1(t) 8 (t — r). 


Nous avons désigné par 6 (f) la matrice fondamentale des solu- 
tions de l'équation 


(29.74) 


(29.75) 


(29.76) 


(29.77) 


d 
D = A (#3. (29.78) 
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Introduisons la notation v(f) pour la matrice fondamentale des 
solutions de l'équation conjuguée 
dy 


On sait que les matrices 6 (t) et v (t) vérifient la relation (18.53) 
8 (pv =v*(0)8(=E, 

où E est la matrice unité. On en tire que 
0% (4) = v-1 (1), v® (1) = 07? (+). (29.80) 


L'expression (80) donne lieu aux relations 


Eve) VE (D) = vt (7)18ve (9 =06 (7) 87* (4) = D (T, t), 


v (va (T)= 10" (01*0% (7) 16 (T) 0-2 (91e = (7, D. (9-8 
Pour que le système (76) soit complètement observable, il faut 
et il suffit que la matrice, analogue à (14), 


T 
H° (to, T)— | OV (TB (0 Q(E) B“(tv(t)}v1(T)&, 


qui d’après (81) peut être mise sous la forme 
T 
#" (to, T)= f O(T,1)B()Q()B°()O*(T,t)dt, (29.82) 
lo 


soit définie positive. 

Définition. Le système (74) s'appelle complètement com- 
mandable si le système conjugué (76) est complètement observable. 

Théorème 4. Le système (74) est complètement commandable 
si et seulement si la matrice #° (t,, T), déterminée par l'expression (82), 
est une matrice définie positive. 

Démonstration. La matrice #° (t,, T) est analogue à la 
matrice (14) et son caractère défini positif est une condition néces- 
saire et suffisante pour que le système (76) soit complètement obser- 
vable. Selon la définition ci-dessus, le système (74) est complète- 
ment commandable. 


La démonstration de ce théorème peut également être immédiate. Admet- 
tons que dans l'équation 


dx 


= AU) z+ B(tw (0, z (to) = 0 (29.83) 


$ 29] THÉORIE GLOBALE DU FILTRAGE 409 


w (t) désigne la commande à choisir de façon qu’à l’instant t = 7 le système 


se trouve à l’état 
z(T)=&#, (29.84) 


où Æ est un vecteur de dimension nr donné. 
En adoptant la commande w (t) sous la forme 


w()=Q()B* (D) D (7T D W'-1(to T) À, (29.85) 
où la matrice #” (t, 7) est définie par l'expression (82), on a conformément à (83), 


T 
z(T)= | O(T,1)B(t)Q(t)B*(t)O®(T, ?) dtW-1(to, T) HA =. (29.86) 
to 


De la sorte, si %#°(to, 7) est une matrice définie positive, le système (74) est 
complètement commandable. 

La démonstration de la proposition, suivant laquelle si le système (74) est 
complètement commandable %"'(t, T) est une matrice définie positive, est ana- 
opus à celle donnée au $ 11, point 6, section 2°, p. 189. Le théorème est démon- 
tre. 


Dans ce qui suit nous allons donner les définitions d’un système 
uniformément complètement observable et d'un système uniformément 
complètement commandable. Dans ces définitions figurent les matri- 
ces o# (t— 0, t) et 9° (t — ©, t) qui, d’après (14) et (82), sont 


t 
M (t— 0, t) — { D"(x,1)C* (TD) R'(T)C (TD) O(r, r)dx, (29.87) 
t—0 


t 
#(t—0,t)= | D(t,1)B(T)Q(T)B°(r)D*(t,t)dt. (29.88) 
t-0 


Définition. a) Le système (74) 
= A(Dz+B(Ew (0, 
z2(t)=C(t)z(t)+v(e). 


est dit uniformément complètement observable s'il existe des constantes 
positives fixées ©, a, B telles que 
0O<LaE< dd (t — 0, t) L BE pour tout t >t, + os. (29.89) 
b) Le système (74) est dit uniformément complètement commandable si 
O0 <aE LH’ (t — ©, 1) L BE pour tout t > 1, + ©. (29.90) 


Pour simplifier l'écriture, on suppose que les mêmes constantes 
o, &, B font partie des deux inégalités (89) et (90) *. Par ÆE on 
désigne la matrice unité. 


* Constatons que pour les matrices symétriques M et N les conditions 
M> Net M > N signifient que la matrice M — est respectivement définie 
positive ou définie non négative. 
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Remarque. Dans les relations (75) et (77) données précédemment nous 
avons supposé que @ (t) est une matrice définie positive. On voit sans peine que 
cette hypothèse ne diminue pas la généralité du problème. 

En effet, soit dans les équations initiales 


= 4 ()z+B (t)w(t), 
2()=C(t)z(t)+v (e), 


® (4) le processus aléatoire vectoriel gaussien de dimension r à moyenne nulle 
et à matrice de corrélation 


(+) 


M [w (tb) w% (t)] = Q (1) 8 (4 — 7) (»+) 


avec Q (!) la matrice symétrique définie non négative r X r. 
La matrice Q (t) peut être mise sous la forme 


dH=T(HE*(), 


où € (t) est la matrice réelle singulière r X r de même rang que la matrice Q (t). 
En introduisant les notations 


v(h=£(hw(t,  ÉH=BF(DEK(), 


on trouve que 
B(t)w(9 = B (1) € (4) w (9 = B (1) w (0. 
La matrice de corrélation du processus aléatoire w (t) est 
M {w (t) w* (t)] = Eô(t — rt), 
où E est la matrice unité. La justification de ce fait est immédiate 
M [w (1) w (1 = MIE (0 w (9 w* (9 €* (1 = _ 
= G() M [w (9 vw (91 6° (0) = € (4) E6 (t — 7) €* (9) = 
= (1) TC (MôU—T) = (0 E° (D 8 (t — Tr) = Q (HE (t — T), 


ce qui coïncide avec l'expression (++). | 
Dans ces conditions, les équations (+) deviennent 


= A(z+È() D(t), 
z()=C(t)z(t)+v (t). 


Désignons maintenant par @ (t) la matrice symétrique définie positive r X r. 
Cette matrice peut s'écrire 


(se) 


Q()=S(4)S* (1), 
où S (t) est une matrice réelle régulière r X r. En introduisant les notations 


D(h=S-1(tjw(ty, B()=B(#)S1(t), 
on a 


Bît)w(rn = Ê (+) S-1 (9 w (0) = B (t) w (t). 
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La matrice de corrélation du processus aléatoire w (t) est 
M {uw (t)wt (r)] = MIS (1) (9 w% (D) ST = 
; = S(t) M[& (rt) w® (t)] S° (x) = 
= S (+) Eô (et — +) S° (x) = S (4) S* (rt) 8 (e — 7) = 
= St) SH ÔÜ(t—7T = Q(t) 0 (t — Tr). 
L'équation (+++) acquiert maintenant la forme de (74): 
dx 


z(=C(t)z(t)+u(t). 
La matrice (88) de commandabilité uniforme du système (74) s'écrit 
t 
W (t—0, = | @(t, t) B(r) Q(x) B* (x) O* (4, +) dr 
t-0 


où Q (t) est la matrice symétrique définie positive r X r. 
Comme 


B()=B()S-1(1 = 8 (0 & (0 S-1(, 
Q(U)=S (1) S* (0), QU) =G()E"*(,, 
il vient 
B (1) Q (9) B* (0 = 
= B() E (0 S-1(0 S (0 5° (9 (S-1 (1° € (9 B* (1) = 


= BC (D E* (DB (n = B (1) B* (te) = B (+) Q (+) B° (+), 


et la matrice (88) de commandabilité uniforme du système (74) peut être rame- 
née à la forme 
t 


Jf° (t — ©, t) = | O (t, T) B (1) Q (r) B* (T) O* (4, t) dr, 
t-0 


ce pus n'est rien d'autre que la matrice de commandabilité uniforme du système 
initial (*). 

Ainsi, sans restreindre la généralité du problème, on peut considérer que dans 
Le système (74) Q (t) est une matrice définie positive, la matrice B (t) tenant évi- 
demment compte des transformations résultant de la normalisation du processus aléa- 
toire initial au processus à matrice de corrélation définie positive Q (t). 


Propriétés\ des solutions de l'équation 
de Riccati. Nous avons obtenu précédemment l'équation 
matricielle de Riccati (28.80; 


= A) Z+ SA%(H) — XC*(#) R1(1)C (D) ZE + 
+ B(t)Q (1) B°(t); Z (to) = Zo- 
Désignons par Z (t; Z,, t,) la solution de cette équation sous la 


condition initiale Z (4) = Z,. Supposons dans ce qui suit que non 
seulement R (t), mais encore Q (t) soit une matrice définie positive. 


LA 
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Soit Z, une matrice définie non négative que nous allons noter 
Z0 > 0. Le lemme qui suit permet de définir les limites entre les- 
quelles sont comprises les solutions de l'équation (28.80), dont 
l'existence locale et l’unicité résultent du fait que le second membre 
de cette équation vérifie la condition de Lipschitz. 

Lemme 1. La solution Z (t; Z,, to) de l'équation de Riccati 
(28.80) à condition initiale E (t,) = Z, > 0 vérifie pour tout t>t 
les conditions: 


OZ (E Lo. to) KO (£, to) ZoD° (4, Lo) + 
t 
+ { O(t,t)B(r)Q (x) B°(x)®"(t, t)dt— 
to 


—=O (t, to) ZoD° (£, to) + #° (to, 1), (29.91) 


où Dit, to) = 08 (1) 8-1 (£4), et 0 (t) est la matrice fondamentale des 
solutions de l'équation différentielle vectorielle (78) 


dx 
7 =A(t) LT. 


Démonstration. L’équation différentielle de Riccati 
(28.80) peut s’écrire 

2 = (4 ()— EC (RAC (2 + Z(A" (D —C*()RT1()C (8) Z]+ 

+ZC*()R1DC(HEZ+B(HOQ()B*(t). (29.92) 


Introduisons les notations Ÿ(f, &)—=%x (4) x”! (t,), où x (ft) est la 
matrice fondamentale des solutions de l’équation différentielle 


SE = [A (0) — 2C* (+) R°1 (1) C (DIE. (29.93) 


L'équation différentielle matricielle (92) à condition initiale Z (4) = 
— Z, est équivalente à l’équation intégrale matricielle 


t 
Z (45 Zo. to) = Ÿ (4: Lo) Lo T° (4, to) + | Fe T)[B(T)Q (Tr) B* (1) + 


HZ(T)C*(T)R (TC (TE (TP (E, that. (29.94) 


Si t — t, est suffisamment petit, on tire de (94) que Z (ft; Z,, to) > 
> 0. Par conséquent, la solution Z (t; Z,, to) existe. 

On peut passer directement de l'équation différentielle matri- 
cielle (28.80) à condition initiale Z (to) = Zo à l'équation intégrale 
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matricielle 
Z (t; Zo, to) = © (£, to) ZoD* (4, to) + 
t 


+ {on B8(0() 8" (DE (4, 7) dr 


to 
Î 


E | D(t,T)Z(r)C* (TDR (T)C(T)E(T)D*(t, That. (29.95) 
to 
Le terme retranché au second membre de (95) étant une matrice 


de Gram, c'est-à-dire une matricé définie positive ou non négative, 
(95) implique que 


Z (4; So, to) KO (£, Lo) Z0D°* (4, to) + 
FE | O(t,T)B(r)Q(t)B*(t) D" (4, t) dr. (29.96) 
to 


La limite supérieure ainsi obtenue de la solution de l'équation 
(28.80) permet de déterminer pour cette équation la constante de 
Lipschitz sur tout intervalle fini, aussi grand soit-il. Donc, l’équa- 
tion différentielle de Riccati (28.80) possède une solution globale 
unique. Le lemme est démontré. 


Au $ 28 nous avons prouvé que la solution de (28.80) peut s’expri- 
mer à l’aide de la matrice fondamentale des solutions du système 
d'équations différentielles vectorielles (28.85) 


= —A (DE+C"() RDC (D p, 


L=B()Q()B°()E+A()h 


où E (t)et u (£) sont les vecteurs de dimension n#. Les équations (28.85) 
entraînent également la relation (28.86) 


u (4) = Z () E (4), 
où Z (t) est la solution de l'équation de Riccati (28.80). 
La matrice fondamentale des solutions de (28.85) est notée 
au $ 28 g(t). Par II (4, t,) on désigne la matrice 2r X 2n 
IT (, do) = 8 (t) 87° (to). 


La matrice II(£, {) peut être mise sous la forme d’une matrice 
partitionnée dont les éléments sont des matrices nr X n 


[1 (£, Lo) Is (4, to) 
re dE (£,to) Ils (4, A | 
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De plus, comme nous l’avons montré au $ 28, la solution de 
l'équation de Riccati (28.80) s'écrit 


Z (4; 20; Lo) = LS (4, Lo) T5 (4, Lo)s (29.97) 


L so (ts Lo) = Iss (4, to) + Iso (é, to) Zo, 
Dso(ts to) = Ia (2, Lo) + Ii (4, to) Zo- (29.98) 


Lemme 2. Si Z, est une matrice définie positive (2, > 0), 
la solution de l'équation de Riccati (28.80) Z (t; Z,, to) est une 
matrice définie positive pour tout t> to. 

Mais si Z, est une matrice définie non négative (2, > 0), alors 
que le système (74) est complètement uniformément commandable, la 
solution de l'équation de Riccati (28.80) Z (t; Z,, to) est une matrice 
définie positive pour tout t > to + 6. 

Démonstration. Montrons d’abord que la matrice 
Ds (t, to) est régulière pour tout { > f, et tout Z, > 0. En effet, 
s'il n'en était pas ainsi, il existerait des #4, > to, Z, > 0 et un 
vecteur non nul n tel que 


Fxi (ti to) n = 0. (29.99) 


Considérons maintenant les équations (28.85) pour chercher leurs 
solutions vérifiant les conditions initales 


ë (to) = 1, H (to) = Zi. (29.100) 


Ces conditions satisfont à la relation (28.86) donnée dans ce qui 
précède. F ? 

Conformément à (28.90) et (28.91), à l'instant f, les fonctions 
E (£) et u (f) ont les valeurs suivantes 


ë (41) FA lo) Ie (4, ail n | 

br latte 9 
Il résulte de (101) que 

Ë (a) = Us (ti, to) + Mie (5 Lo) Z1ln (29.102) 
ou, d'après (98) et (99), 


LE (4) = Zss (1, to) n = 0. (29.403) 
De plus, d’après (28.86) on a 
ph) = 2 (4; Zu to) Ë (4)- (29.104) 


Multiplions la première équation (28.85) à droite par p et la 
deuxième équation (28.85) à gauche par E*. En additionnant les 
premiers et les seconds membres des équations nouvellement obtenues 
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et en les intégrant dans les limites de £, à £,, on obtient la relation 


E* (44) pe (1) = E° (Lo) H (Co) + | (B* (s)E (s), Q (s) B* (s)E (s)) ds + 
to 


Î4 


+ (CHU, R(s)C(H()ds (29.105) 
to 
ou, d'après (103) et (100), 


t 
eme Zum) À (B* (5) E (6) Q(S)B* (NE (8) ds + 
lo 


{ 


+ D (C( ns), R1(s)C(s)n(s))ds=0. (29.106) 


{0 


Dans le lemme concerné, il suffit de supposer que Q ({) soit une 
matrice définie non négative et non pas forcément une matrice 
définie positive. Puisque Z, est une matrice définie non négative 


et R(t) une matrice définie positive, pour justifier les relations 
(106), il faut que 


Cut) —=0,1E (to th). (29.107) 
De cette façon, la première équation de (28.85) devient 
HA (DE Elton. (29.108) 


En intégrant cette équation on obtient 
O—E (4) = D (to, ty) n = [8 (to) 07! (4)]*ns (29.109) 
où 6 (f) est la matrice fondamentale des solutions de l'équation (1) 


dr 
7 = À (4) Le 


Mais comme 6 (t) est une matrice régulière, il s'ensuit de (109) 
que n = 0. Cette réduction à l'absurde prouve que 2, (t, to) 
est une matrice régulière pour tout { > {, et tout Z, > 0, et l’expres- 
sion (97) définit réellement la matrice Z (4; Z,, t,) pour tout 
t>t, et tout Z, > 0. 


Soit maintenant Z, une matrice définie positive (Z,>>0). Dési- 
gnons par n le vecteur de dimension n 


n = Ds, (f, to) n- (29.110) 
Supposons qu'il existe un vecteur non nul n tel que 


in, 2 (: Zoo to) n) = 0, (29.111) 
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c’est-à-dire que la matrice Z (f; Z,, to) n’est pas définie posi- 
tive pour tout t. En tenant compte de (97), l’expression (111) 
peut s'écrire 


(Zs (£, Lo) n; Z (t; Zo» lo) Ts0 (£, lo) n) = 
= (Ds (t, to) n: Lx (t, to) n) = (n, DS, (£, Lo) LS (E, to) N) = 


(29.112) 

Supposons que les conditions initiales du système d'équations 
(28.85) soient | 

& (fo) = n, (to) = Zon. (29.113) 


Les conditions initiales (113) vérifient la condition nécessaire (28.86). 
Sous les conditions initiales (113), on a d'une façon analogue 
à (103) 
ë (£) — Ts (£, to), 
u(t)=2 (£; Zo, Lo) L% (£, to)n = Lx (£, to)n. (29.114) 
On tire de (114) que 
(4), HO) = (Ds (6 to)n, Leo (és Lo) 1) = 
= (n, DY, (e, Lo) LS (£, to) n): (29.115) 
D'une façon analogue à (105), on a la relation 


EG), HD) = Co). H (bo) + 
{ 
+ [ (B* (ES), Q (5) B* (5)E (5) ds+ 


to 
+] (C(s)u(s), R(s)C(s)H(s)}ds (29.116) 
ou, d’après eo (112) & (113), 


O=(n, sen + | (B*(S)E(S), Q(s) B°(s)E (s)) ds + 
lo 


{ 
+T(CE)u(s), Rs) C(SH(s)}ds. (29.117) 
to 


Etant donné que Z, et À (t) sont des matrices définies positives 
et Q (t) > 0, la relation (117) n’est possible que pour 1 = (. Il en 
résulte que la relation (111) n’est possible que pour n = 0 et on 
aboutit ainsi à une contradiction. 

De cette façon, si Z, est une matrice définie positive, la matrice 
Z (4: Ze, to) est également une matrice définie positive pour tout 
t> Lo. 
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Soit maintenant ©, la matrice définie non négative, alors que 
la matrice 


T 
(to T)= | O(T, s)B(s)O(s)B°(s)D°(T, s)ds (29.118) 
to 
est définie positive. 


Supposons qu’il existe un vecteur non nul n tel qu’il donne lieu 
à la relation (111) 


n, 28 Zos to) 1) = 0 pour t>T. 


Les conditions initiales (113) conduisent aux relations (116) 


L 
O=(n, Zon)+ | (8° (5)E (5), Q(s) B* (5) E (5) ds + 
lo 


t 
+ [Cu (s), R°1(s) C'(s)p (s)) ds. 
to 


R étant une matrice définie positive, pour que la relation (116) 
existe, il-faut que 


C(su(s) =0,5sE (to, t). (29.119) 
La première équation (28.85) devient 
= — A° (#8, E(to) =; (29.120) 


sa solution s'écrit 
E (4) = O® (to, t)n = [0 (40) 87? (t)]*n. (29.121) 
Pour que la relation (116) ait lieu, outre (119) il faut également que 


t 
[8 (S)E (s), Q(s) B*(s)E (s)) ds = 0. (29.122) 


En portant dans (122) l'expression (121) de Ë (s), on ramène (122) 
à la forme 
(n, In) = 0, (29.123) 
où 
T 
J — | D(to, s)B(s)Q(s) B*(s)D* (to, s) ds. (29.124) 
lo 
Comme 
D (T, to) JO? (T, to) = W° (to, T) (29.125) 


27-0393 
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° (toy T) étant par hypothèse une matrice définie positive. et 
O (t, t,) une matrice régulière, la matrice J est également une 
matrice définie positive. C’est pourquoi la relation (123) implique 
que n —0. La contradiction obtenue prouve qu'avec 1 > T 
la matrice Z (t; ©,, to) est définie positive. 

On voit sans peine de ce qui vient d'être dit que si le système 
(74) est uniformément complètement commandable, c’est-à-dire si 
les inégalités (90) ont lieu, alors Z (4; Z,, t,) est une matrice 
définie positive pour tout t > {, + ©. Le lemme est démontré. 

Lemme 3. Si le système (74) 


d 
= A(t)g+B(t)w(t), 
Ce) = C(E)g(E) +v (+1) 
est uniformément complètement observable et uniformément complète- 
ment commandable, et si © (t,) = Z, est une matrice définie non néga- 


tive, pour tout t >t, + © la matrice Z (t; X,, to) est uniformément 
bornée et vérifie la condition 


ES (t: So to) LA l(t— 0, D + (t — 0,1) 
pour tout { > lo + 0. 


Démonstration. Dans ce qui précède nous avons cons- 
truit pour le système (1) 


le filtre (48) 
= A(t)z+K (t){2(1)—C(t)z], 


où À (t) est défini par l'expression (50) 
K (D = A1(t6, t) C* (E) RTE). 


Le filtre (48) donne une estimation non déplacée z(T) de l'état x (T} 
du système (1), c'est-à-dire l’estimation vérifiant la condition (58) ; 
M {x (7)] = x (T), avec une variance minimale de l’erreur. De plus, 
on montre que cette estimation est définie par la relation (55) 


T 
2(T)= | FT, DK (tz(t) dt, 
to 
où la matrice 4 (T,t) est définie par la relation (52). La fonction 


z (4) intervenant dans l'expression (55) est présentée sous la forme (9) : 
2H —=C(DOD(, T)r(T)+ov(t), bEt<T. 
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La variance de l'erreur d'estimation z(T) de l’état x (7) dusystème (4), 
donnée par le filtre (48), est, d’après (60), 
cov{z (T)] = M {{z(T) — x (T)l {x (T)l — x (T)*} — 
= Mt, T). 


Supposons maintenant qu’on applique le filtre (48) pour obtenir 
l'estimation q (T) de l’état q (T) du système (74). 
En introduisant les notations 


T 
6 (T)= | D(T, v)B(v)w(v) dv (29.126) 


to 
on peut mettre l’état q (T) du système (74) sous la forme 
g(T) = z(T) + ôg (T), (29.127) 


où z (T) est l’état du système (1). 
L'expression (9), appliquée au système (74), devient 


(D =C(DO(, T)lz(D +6q(T]+v(tn, ET, 
ou 


LO=C()O(E, T)z(T)+v (0 + 
T 
+C(DD(, T) for, v) B(v)w (v) dv = 
to 


T 
= 2(1H+C(O(, T) | D(T, v)B(v)w(v)dv. 
to 


(29.128) 


Conformément à (55), l'estimation q (T) de l’état q (T) du sys- 
tème (74) est 


T 
Q(T)=2(T)+ | UT, DÉC X 


to 
T 
x ®(r, T) | D(T, v)B(v)w(v)dvdr. (29.129) 
to 


21% 
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Le premier et le deuxième terme de l'expression (129) sont non 
corrélés. Donc 


cov{g(T)1= cov{z(T)1+ 
T 
+ cov [1 SE (T, TK (x)C(T)O(x, T)drX 
to : 
x | O(T, v)B(v)w(wv) dv], (29.130) 
{ 
où, d’après (60), 
cov {x (T)] = #1 (t,, T). 
En tenant compte que d’après (52) 
GC (T, T) = AT (to, T) ®* (+, T) 4 (to: t), Lo <TET, 
on peut, en vertu de (50), mettre l'expression (130) sous la forme 
cov (q (T)] = A1 (to, T) + £, (29.131) 


avec 


T 
£=cov [| M (to, T)D®(t, T) 4 (to, 7) HE (to, T) X 
to 


T 
x CT) Rx) C (x) D(x, T)dr | O(T, v)B(v)w(v) dv] 
te 
ou 


T 
£ = cov | #1 (to, T) | D*(t, T)C* (x) R-1(T) x 
to 


T 
x C(t)O(r, T)dr | O(T, v)B(v)w(v) dy | . (29.132) 
to 


D'après (14), le deuxième facteur du second membre de (132) est 
la matrice ce# (t,, T); l'expression (132) devient donc 


£ = cov [( O(T, v)B(v)w(v) dv | (29.133) 


to 
ou 
F 


£=M l O(T, v) B(v)w (v) dv | w* (p) B*(p)@*(T, p) dp|= 
to to 
D 


FU 


T 
= [ (or, BW) Miw() w°(P)1B* (p)O*(T, p)dvdp. (29.134) 
to 
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Puisque 
M {w (v) w* (p)] = 6 (v — p) Q (v), 
l'expression (134), en vertu de (82), se met sous la forme 


T 
£— | O(T, v)B(v)Q(v) B*(V)D°(T, v)dv=W (to, T). (29.135) 
to 


Ainsi, d’après (131) et (135), on a 
cov (a (TT) = At, D +W (to T). (29.136) 
Le filtre (48) n'étant pas optimal pour le système (74), la variance 


Z (t) de l'erreur d’estimation de l’état q (T) par le filtre (28.82) 
optimal pour le système (74) vérifie la condition 


S (T3 © (to), to) Kcov [q (T)] (29.137) 
ou, en vertu de (136), 
ZE (T; 2 (to), to) LA (ts T)+ HW (to T). (29.138) 


Remplaçons maintenant la limite supérieure 7 de la relation (138) 
par t, et sa limite inférieure t, par { — o. On a alors 


Z(t; Z(t— 0), t— 0) LA (t — 0, t) + 
+ (1 — ©, t). (29.139) 
Dans (137), la matrice symétrique définie non négative Z (4) = 
—= Y, est la valeur de la matrice Z à l’instant £,. Par suite, à l'instant 
t — o la matrice Z (t — ©) présente la valeur de la solution de l’équa- 
tion de Riccati (28.80) sous la condition initiale Z (4) = Z,, ce 
que nous allons noter 


Z(t—0)=2(t— 0; 2, to), t > to+0. (29.140) 
Maintenant on justifie sans peine l'identité 
Z (tt: S(t— oc), t— oo) =2£E(t; 2, to), t>to + 6. (29.141) 
Ainsi, la relation (139) devient 


Et; =, to) LA (t— 0, 1 + (t — 0, t), 
t>to +. (29.142) 
Le lemme est démontré. 


Dans le lemme 2 il a été démontré que si Z (#) = Z, est une 
matrice définie non négative, alors que le système (74) est complète- 
ment uniformément commandable, Z (£; Z,, to) est une matrice 
définie positive pour tout £ > {o + ©. 

Puisque 


ES UE 
D da: 
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en vertu de (28.80), la matrice © -! satisfait à l'équation différen- 
tielle 


dZ-i 
dt 


= —Z"14()— A" (4) SA+EC* (4) RA(1)C (1) — 
—2"1B(t)Q(t) B*(t) ET. (29.143) 


Ici la matrice Z-1(4, + o) = Z-t(t, + ©; Zo, to) est définie 
positive. | 

Nous avons introduit précédemment le système (76) qu’on appelle 
conjugué du système (74). Désignons par € (4) la matrice de corréla- 
tion de l'erreur d'estimation optimale de l’état du système (76). 
La comparaison de (74) et de (76) permet d'établir la correspondance 
suivante entre les paramètres de ces systèmes: 


Système (74) Système (76) 


A(t) — AS (+) 


B (t) C* (1) 


B® (+) 


Q (t) RT (4) 


R (t) Q-1 (4) 
c41 (tos T) H° (to, T) 
# (to, T) Al (to, T) 


2 (1) = (4) 


Si on en tient compte, on voit que 


E (4) = ZT (6) (29.144) 


parce que si on remplace les paramètres de l'équation différentielle 
de Riccati (28.80) par les paramètres correspondants du système 
conjugué (76), (28.80) se ramène à la forme (143). 
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Lemme 4. Si le système: (74) est uniformément complètement 
commandable et uniformément complètement observable, et si Z (t,) = 
— X, est une matrice définie positive, la matrice Z (t; Z,, to) vérifie 
la condition 


[SL (Et — 0, 1) + A (t — 0, DIT LE (t; Zo, to) 
pour tout { > lo + ©. 


Démonstration. En appliquant au système conjugué 
(76) l’estimation (142) obtenue dans le lemme précédent, on obtient 


24; Zo to) SW (tt — 0, 1) + 
+ #(t — ©, t), t>lo +0. (29.145) 
Constatons que si deux matrices carrées régulières P, et . donnent lieu à 
la relation 
Pi < Pos (29.146) 


ce qui signifie que .P. — P, est une matrice définie positive ou définie non néga- 
tive, les inverses vérifient la condition 


PAZ Pi, (29.147) 
c'est-à-dire P51— P;:l est une matrice définie positive ou définie non négative. 


Conformément à (147), la relation (145) peut se ramener à la 
forme 


(HW T(—o, 1) +A(— 0, DITS E (t; Los to), 
t>to + 0. (29.148) 
Le lemme est démontré. 
Théorème 5. Si le système (74) 
= A(1)z+B (t) w(f), 
z()=C (Hz (0) +v (0) 


est uniformément complètement observable et uniformément complète- 
ment commandable, le filtre optimal (28.82) 


L=A(De+G(1z()—C(e1. 
G(t) = Z(t) C*(e) RT1(t) 


est uniformément asymptotiquement stable, c'est-à-dire que la solution 
triviale de l'équation différentielle homogène 


P 2(A()—2 (9 C° (D RE CIE (29.149) 


composée à partir de (28.82) avec z (t) = 0 est uniformément asympto- 
tiquement stable. 
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Démonstration. L'équation différentielle conjuguée de 
(149) est de la forme 


& =[—A* (1) + C*() RD C( ZE (DIE (29.150) 


Dans ce qui précède (93) nous avons désigné par * (t) la matrice 
fondamentale des solutions de l'équation (149), et par W (46, tv), 
la matrice 

ft, TD =x(t) x"! (Tr). (29.151) 
Introduisons la notation © ({) pour la matrice fondamentale des 
solutions de l'équation (150), et A (4, t) pour la matrice 

A, 7) = 8 (4) 8-1 (x). (29.152) 
Onsait ‘que les matrices x (£) et Ÿ (é) vérifient la condition (18.53) 


x* (HP (D = (Dx(D=E, 
où E est la matrice unité. On en déduit que 
nv (4) = 01), Ÿ*() = xt (1), 
© (6) O1 (Tr) = Let (0)]" x (x) = [x (x) x (Ie. 
Ainsi 
A (4, t) = Y® (x, t). (29.153) 


On demande de montrer qu’il existe des constantes positives c 
et c, telles que * 


I À (4, t + o) | <ce-°2 pour tout {#. (29.154) 
La relation (154) est équivalente à la relation 


IF G+o, D =IIT (+ 0, à) I<ae- pour tout f, 
(29.155) 


ce qui traduit précisément la stabilité asymptotique ‘uniforme de la 
solution triviale de (149). 

Pour établir la validité de la relation (154), adoptons comme 
fonction de Liapounov la fonction 


V(E, D = ÉD (LE. (29.156) 


* Désignons la norme de la matrice À par || À ||. En désignant pari|| z || 
la norme du vecteur x de dimension n de l’espace X de dimension n et en posant 
Izll= Vz*z, adoptons comme norme || À || de la matrice À la grandeur 

Il Az |] 
A || = Sup ———. 
I À |] Et TE 


xF0 
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Puisque, d’après le lemme 2, pour 20 > > 0 la matrice £ (t; Z,, to) >> 

— avec t > lo + 0, et pour 29 >0, ZE (t; 2, to) > 0 avec 
> to, d’après (142), (145), (89) et 180), > (t) est bornée supérieure- 

ie et inférieurement au moins pour tout £ > {, = to + 20: 


E<2(D< ESP E. (29.157) 


0< TFaF 


De cette façon, la fonction V (E, t) est uniformément bornée supérieu- 
rement et inférieurement 


& 110 É 4 e 119 
gas EF < V D < st LE 
pour tout {=>tfi=to0+20 (29.158) 


Cherchons maintenant la fonction D à partir de l'équation diffé- 


rentielle (150). En introduisant la notation 
À (D =—A* (D +C*(b R1(DC (HE (r (29.159) 


l'équation (150) peut se mettre sous la forme 
Æ AE. (29.160) 
En vertu de (156), 

dV 

= Et (a5++ + 2A)E. 


Si l’on porte dans cette expression la valeur de “2, tirée de (28.80), 


FL 


Pi É IS (DC ()R I (HDC(HEÈ(+B(E)Q(G)B* (DIE (29.161) 


La matrice entre crochets du second membre de (161) étant une 
matrice de Gram, la forme quadratique du second membre de (161) 
ne peut être négative et la décroissance de la fonction V (E, ft) avec 
t— oo est impossible. 

Pour évaluer l'ordre de croissance de la fonction V (E, t), cher- 
chons la limite inférieure de l'intégrale par rapport à { du second 
membre de l'expression (161). Soit 


tLT<t+ 0. (29.162) 
Conformément à (150) et (152), 
EtG+o)=A(t+ Oo, Tv) EË (r). (29.163) 


Comme 
[A (& + 0, t)l-! = A (x, t + o), (29.164) 
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(163) entraîne que 
E(t)=A(T, (+0) E(t+o). (29.165) 
Introduisons la notation 
u (tr) = R1 (1) C(r) ZE (DE (x) = 
= R1(DC(T)E(TDA(T t+0)E(t+ 0). (29.166) 


D'après (166), l'équation différentielle (150) peut se mettre sous la 
forme 


A (HD E+C*(bu(d. (29.167) 
Nous avons désigné précédemment par v(f) la matrice fonda- 
mentale des solutions de l'équation (79) 


d 
= — A* (4) y. 


En introduisant la notation 
ht, T7) = v (8) v'!(r) (29.168) 


appliquons l'équation (167) pour obtenir 

t+0 
Et+o)=h(t+0, T)E(r) + | h(t+o, v)C*(v)u(v) dv. (29.169) 
Comme 


{R(G+O, TT) '=h(T, 1 +0), h(t,t+o)h(t+ oo, v) =Rh(Tt, v), 
(169) implique que 


t+0 


h(T, t+0) Et+o)=E(r)+ | h(t, v)C*(v)u(v)dv. (29.170) 


Puisque 
ht, 7) = O® (tr, 1) 


la relation (170) devient 


t+0 
Do, DE(G+o)=E(T)+ | O*(v, 7) C*(v)u(v) dy 
ou ‘ 
t+0 
E(t)=®0" (+0, t)E(t+0)— | D" (v, T)C* (v)u(v) dv. (29.171) 


T 
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D'après (165), l'expression (171) devient 
A(T, t+0)E(t+0)=®"(t+0, t) E(t+ 0) — 


t+0 


_ | D°(v, T)C*(v)u(v)dv. (29.172) 


Introduisons les notations 
+0 t+0 
fu Rue | EME (REX 
t î 
t+0 
x CZ (ME (dE (+0) | A*(v, +0) x 
î 
X E (v)C*(v) RT1(v) C(v) Z (1) A(v, t+0)dv Ë(+0)= 
= et |Ë (+ 0)f, (29.173) 
t+0 : L t+ 0 
[ EG)BMO() BE ()dv= (+0) | A, 140) x 
t t 
X B(v)Q(v)B*(MA(v, t+o)dvE(t+o)=n°||É(t+0)l? (29.174) 
où e° et n° dépendent de f + ©. 

La somme des fonctions sous le signe somme de (173) et (174) 
représente le second membre de la relation (161). C’est pourquoi 
en désignant 

Ô* = &° + 1° (29.175) 
on trouve à partir de (161), (173) et (174) que 


VEG+o), t+o VER D= | 
—= 06° || E (4 + 0) |f. (29.176) 
Passons maintenant à certaines transformations qui nous servi- 
ront pour évaluer la grandeur Ô*. 
Remarquons au préalable que (171) peut s’écrire 


t+0 
E(t)= 0° (+0, 7) [E (+ 0)— | D* (v. 1 0) C* (v)u(v) dv (29.177) 
ou ‘ _ 
E (t) = D* (4 + o, T'IÈ(t + o) — S (r)l, (29.178) 
avec 
t+0 


S (rt) = | D® (v, 44 0) C* (v) u (v) dv. (29.179) 


T 
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L'expression (174) se met sous la forme 


t+0 


ntlEG+o)P= À IÉ(G-+0o)—S* (11 x 


t 
x D(t+0, 1) B(x)Q(r) B*(r)D*(t+ 0, 7) x 
X[Ë(C-Lo)—S(r)]dr (29.180) 
ou 


t+0 
ne lEG+o)P =EE+o) | ZMarEt+o)— 
L 


t+0 t+c 


—Ee+o) | Zmsoa- | sm Z (max 
t t 


t+0 
XEt+o)+ | S'()Z(TS(Tdr, (29.181) 
1 


avec 
Z(t)=O(t+0, r)B(rx)Q(x)B*(r)D°(t+ 0, Tr). (29.182) 
Puisque d’après (182), £ (x) test une matrice de Gram, il vient 


t+0 


| S° (TZ (x) S(T dr >0. (29.183) 


Etant donné que Z (rt) = Z* (x), le deuxième et le troisième terme 
du second membre de (181) coïncident. 

En éliminant le dernier terme du second membre de (181) et en 
retenant que d’après (88) 


t+0 
| £a (t t+0), 


L 


on obtient la relation 


nÉC+)P>ÉË(C+0), (4, 1+0)E(t+0))— 
1+0 
—2 (EE+0), \ Z HS(Har). (29.184) 
4 


Constatons que selon (90) on a 
W(,t+0o)>aE >0 
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et, donc, 


ŒE(t+ 0), HU, t+o)E(t+ 0))> all E (4 + 0) [°. (29.185) 
C'est pourquoi (184) peut être remplacée par l'inégalité 


t+0 
nllE(+o)P>all E (+0)? —2 (EE+0), | ZoSt dr) | 
4 


(29.186) 


Passons maintenant à l'estimation du deuxième terme du second 
membre de (186). Conformément à l'inégalité de Bouniakovski- 
Schwarz, 


IS=| Ç (1, #-+0)C (ua ff< 


t+0 
<[ {10640008 FOIRE Ould] < 


< | f D (v, 1+0)C*(v)R-1(v)C(v) D (v, t+0)d| x 
t 


x | F u° (+) R(u(y dv]. (29.187) 


D'après (87) et (173), (187) peut s'écrire 


IS (DIF <e IA, t+0) Il EG + 0). (29.188) 


Puisque d’après (89), # (4, t + o) < BE, où E est la matrice unité, 
il vient 


LA t+01<8 (29.189) 
et on a à partir de (188), 
IS (D eB'2 1 È G+ 0) Il (29.190) 


En vertu de (190), 


59 t+o 
| Zosoal<(1Z01s@Ié< 
t t 


t+0 


< | IZtolér eBA|ÈG+o)I. (29.194) 
t 
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Puisque d’après (182), £ (x) est la matrice de Gram, 
t+o t+0 
fiZonx=|f Zoa|=ir(tt+0i<8, (29.192 
L LA 
et l'inégalité (191) devient 
{+0 
JS Zeoscoar] <ep:1 Ee +0). (29.193) 
L 
Il résulte de (193) que 
t+0 
lÉEe+o, | Z@S (ar )|<ep:1 «+ 0)1f. (29.194) 
[4 


Avec (186) et (194) on a 


n° ILE (GE + 0) > (a — 28%) | EG + o)|F (29.195) 
et, par suite, 


n° > a — 2ep°2. (29.196) 


Il est aisé de voir que e° et n° ne peuvent pas s’annuler à la fois. 
En effet, si e — 0, (196) implique que n° = & > 0 et donc 6? > a > 
> 0. Et si n° = 0, la relation (196) devient 


0 > «a — 2ep°/?2, 
et, par conséquent, 
2ep°/2>a, 
ou 


Dans ce cas 


Ainsi nous avons obtenu pour Ô* l'estimation 
; ‘ : a 
ô>k>0 où = min (a, ns) ; 
De la sorte, la relation (176) s'écrit 


VEG+o), t+0) —VE(R, > 
>zkK||E(G+o)|F>0, (29.197) 


ce qui prouve la validité de la relation (155), c’est-à-dire la stabilité 
asymptotique uniforme du filtre optimal. Le théorème est démontre. 


8 29] THÉORIE GLOBALE DU FILTRAGE 431 


Théorème G. Soit le système (74) 
dr 
7 =A(t)z+B()w(t), 
2()=C(t)z(t)+v(t) 


uniformément complètement observable et uniformément complètement 
commandable. 

Alors, les matrices Zta (t; S'®,1,) et 2h (1; ZX, 1), qui sont 
des solutions de l'équation de Riccati (28.80) sous des conditions initiales 
respectives 2% (1) = Zi et ZE (8) = ZX), où EX et ZE sont 
des matrices définies non négatives, vérifient la condition: 


[2 (+0; 209, t)—20 (+0; 29), L)< 
<cie- "| 200 (5 209, to) — 20 (45 269, doll 
pour tout {=>10. (29.198) 


Jci c, et c, sont des constantes positives qui font partie de l'expression 
(195). 
Démonstration. Pour condenser l'écriture, introduisons 
les notations 
Zy= DU (4 3{0), to), Zo= 2) (; EC), 4), (29.199) 
A(t)= Zi — Ze. (29.200) 


Conformément à (28.80), on a 


= A (4) Zi 244% (0) — SC (#) R°1 (0) C (9) a + B (+) Q (E) B* (e), 


7 = À (+) Z2+ Z2A4* (4) — 20° (1) R1 (1) C (1) Z2+ B(t)Q(t) B° (+). 
(29.204) 
L'expression (201) conduit à 
2 A (8) = 44 (6) À (1) + A (#42 (0), (29.202) 
avec 
AD = A(D— EXC (DR IDC), ii = 1, 2. (29.203) 


On peut vérifier directement que la solution de l'équation différen- 
tielle matricielle (202) est de la forme 


A() = (6 to) À (to) F3 (4, to); (29.204) 


432 SYSTÈMES STOCHASTIQUES (CH. 8 


où, d’après (151), 
a Ce to) = %i (0) %5 (to), = 1,2 (29.205) 


et où x; (i) est la matrice fondamentale des solutions de l'équation 
différentielle vectorielle 


Bi 4er  i=1, 2, (29.206) 


c'est-à-dire x, (£) et %: ” sont des matrices fondamentales des solu- 
tions des équations qui constituent l'équation du filtre optimal (149) 
pour Z (4) = ZM (4; 2, t)let ZX (t) = Z® (1; ZX, &) respec- 
tivement. 

Il résulte de (204) que 


AGt+o) =, (+0, D AE (+ 0,6). (29.207) 
D'où, en vertu de (155), 
IA (+0) 1 <cie-%2 |] A (e) ||, (29.208) 
ce qu’il fallait démontrer. 

Théorème 7. Soit le système (74) uniformément complètement 
observable et uniformément complètement commandable. La solution 
de l'équation de Riccati (28.80), associée à la condition initiale X (t,) = 
= 0, possède alors pour t, — —o la limite 

lim Z2(t; 0, to) = D (£) (29.209) 
to—>—0co 
qui existe pour tout t. 
Démonstration. Considérons deux solutions de l’'équa- 


tion de Riccati (28.80) qui correspondent à des conditions initiales 
différentes 


Z(a) (4; 0, to) =Z(t; 0, to) (29.210) 
et 
L ZE) (1, 0, 4)=2Z(t; 0, #1), (29.211) 
ou 
b<h<t. (29.212) 


Si l’on désigne 
29 (4)= 200 (41; O, to), 
la solution (210) peut s'écrire 
2(a) (4: O, to) = ZX) (1; Z(a) (ti), ta). (29.213) 
En vertu du lemme 2, pour £, > t, + ©, la matrice Z‘* (£,) est 


définie positive. D’après (214), la matrice 2° (4,) = O0. 
En raison du théorème 6 et conformément à (207), on a 


Z (a) (£ ; Z(a) (és), ts) — 2) (£; 0, ls) = 
= Vif, 1H) 20 (H) Yet 4). (29.214) 
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Le second membre de l'expression (214) est une matrice définie 
positive; donc 


EG (1; ZM (4), 4)> 2 (1; O, 14), 
ou, d’après (210), (211) et (213), 
2 (t:0,4)> 2 (t; 0, £,), bo ht. (29.215) 
JE Ainsi, la matrice Z (t; O0, t,) ne décroît pas avec la diminution 
de t,, et d’après (142), elle est bornée supérieurement. On en tire, 
en vertu du théorème de la convergence monotone d’une série des 


opérateurs positifs dans un espace de Hilbert, que pour {, —>— oo 
la matrice Z (t; O, £,) tend vers la limite 


lim Z(t; 0, t)= (1), 


to—>— © 


qui existe pour tout {. Le théorème est démontré. 

Théorème 8. Soit le système (74) uniformément complètement 
observable et uniformément complètement commandable. Toute solution 
Z (1; Zo, to) de l'équation de Riccati (28.80) vérifiant la condition 
initiale ZX (t,) = Zo, où lo > —o et où Z, est une matrice définie 
non négative, converge alors uniformément vers Z (t), où la matrice 
S"(t) est déterminée par l'expression (209). En ce sens Ÿ (4) est un 
état d'équilibre mobile qui vérifie (28.80). 

Démonstration. (Considérons l'équation différentielle 
homogène (149) obtenue de l'équation différentielle du filtre optimal 
pour z (t) = 0: 


æ = [4 (6) —2Z (1) C* (4) R71(2) C'(t)]p. 


D'après ce quiaé té démontré précédemment, la solution triviale de 
(149) est uniformément asymptotiquement stable. 
Considérons la fonction 


V (p, t) = p*Z”-t (1) p. (29.216) 


Sa dérivée par rapport au temps _. est en vertu de l'équation 
différ 'ntielle (149) et, conformément à (143), 
dv - 
= —p* [271 (1) B (8) Q (6) B° (2-1 (0 + 

LC*()R1()C(t)]p. (29.217) 

La matrice entre crochets du second membre de (217) étant une 
matrice de Gram, la forme quadratique du second membre de (217) 
ne peut être positive et la croissance de la fonction V (p, t) avec 
28—0393 
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l'augmentation de £ est impossible. Ainsi, 


V(p ( + 0), t + 0) — ŸV'(p (), D <O0 (29.218) 
ou 
p*G+o)E2T(t+ o)p(t+ 0) <p* (tr) ET (8) p (4). (29.219) 


La solution triviale de l’équation (149) étant uniformément asympto- 
tiquement stable, 


le C+o)l< Ip (|. (29.220) 
On déduit de (219) et (220) que 
Et(t+o)< ZT! (t), (29.221) 
d’où, conformément à (146) et (147), 
2(t+o) 22 (1). 


De cette façon, la matrice Z (4; Z,, t,) ne décroît pas avec l’aug- 
mentation de £. De plus, d’après (142), la matrice Z (t; Z,, to) 
est bornée supérieurement. On en tire que toute solution Z (t; Z,, to) 
de l’équation de Riccati (28.80), où Z, est une matrice définie non 
négative, converge uniformément vers À (f), où Ÿ (t) est la matrice 
définie par l'expression (209). Le théorème est démontré. 


Systèmes stationnaires. Dans le cas où (74) est. 
un système stationnaire, c’est-à-dire où À, B, C, Q et R sont 
des matrices constantes, la solution de l’équation de Riccati (28.80) 
ne dépend que de la différence t — {,. Dans ce cas, Z (t) = Z = 
= Const. 

Notons encore que les systèmes complètement commandables 
(observables) stationnaires sont en même temps des systèmes unifor- 
mément complètement commandables (observables). 

Théorème 9. Supposons que le système (74) soit stationnaire, 
c'est-à-dire que À, B et C sont des matrices constantes, alors que les 
matrices Q et R, des matrices constantes définies positives. Supposons 
également que le système stationnaire considéré (74) est uniformément 
complètement commandable et uniformément complètement observable, 
c'est-à-dire qu’il vérifie les conditions 


rang{B AB...AT1B]=n, 
rang [C* AÀ*C*... A1C*]= n. 


Alors, les résultats suivants ont lieu : 
1°. La solution Z (t; 0, t,) de l'équation de Riccati 


SE _ 43 +SA+_ SC*R-ICE + BQB* (29.223) 


(29.222) 
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possède pour tÿ9— —o la limite 


lim Z2(t; 0, t)=È (29.224) 
to—— 
qui existe pour tout t; de plus, Ÿ est une matrice constante symétrique 
définie positive qui est solution de l'équation algébrique matricielle 
non linéaire 


AZ + SA* — SC*R-ICZS + BOQB* = 0. (29.225) 


2°. Toute solution ZX (t; O, t,) de l'équation de Riccati (223) 
vérifiant la condition initiale Z (to) = Zo, où to > —o, et où 2, 
est une matrice définie non négative, tend avec t — oo uniformément 
vers Ÿ ; c'est-à-dire la matrice Ÿ est l'état d'équilibre défini positif 
unique vérifiant l'équation différentielle de Riccati (223). 

Démonstration. La première partie du théorème, c'est-à- 
dire la proposition (224), se déduit du théorème 7. La deuxième 


partie se déduit du théorème 8. La matrice Z est définie positive 
d’après le lemme 2. L'’unicité de la solution constante de l’équation 
(223) se déduit du fait que plus d’une solution constante contredirait 
le théorème 6. Le théorème est démontré. 


3. Algorithme de construction de la solution limite de l'équation de 
Riccati pour les systèmes stationnaires à temps infini d'observation. Con- 
sidérons l'équation de Riccati (28.80) 

À = À (e) SL SAS (t— SC (+) R=1 (+) C (D EH 


+B(t) Q(t)B*(1) Z(to) =2È> 0. 


Pour les systèmes stationnaires, les matrices 4, B, C, Q, R'sont constantes 
et l'équation (28.80) s'écrit 
= A3+TA*—EC*R-ICE + BQB*, S(t)=20>0. (29.226) 
L'équation du filtre optimal (28.82) d'un système stationnaire devient 
dp 


= (A—SC*R-IC) p+EC*R-1s (1), p (to) = 20 (29.227) 
Introduisons les notations 
R—C*R-IC, (29.228) 
L= BQB*. 
L'équation de Riccati (226) se met alors sous la forme 
= AS+ SAINS L, E(t)=20> 0. (29.229) 
L'équation du filtre optimal (227) devient 
TP (A— ER) p+ CRE (9 p (to) = 7e. (29.230) 


28° 
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Le système d'équations différentielles vectorielles (28.85) du système 
stationnaire concerne est 


dë 

FN — AXE + Ru, 

du ” 

= LE + A, (29.231) 
où E (t) et p(t) sont les vecteurs de dimension n. 1u1 

Désignons par Ÿ la matrice partitionnée 
M — Œ: 1). (29.232) 
L À É 


Par S (©) on désigne le second membre de l'équation différentielle matricielle 
de Riccati (229) 


S (£) = AZ + 54% — SNS + L. (29.233) 


Comme nous l’avons montré plus haut, si le système initial (74) est station- 
paire, s’il vérifie les conditions d'observabilité et de commandabilité (222), 
Q et R étant des matrices constantes définies positives, alors pour t + la 
solution limite de l'équation (229) est la matrice Z symétrique définie positive, 
solution de l’équation algébrique matricielle non linéaire 


S (E)= 0. (29.234) 


La solution £ = Ÿ (où Ÿ est une matrice symétrique définie positive) de (234) 
existe et est unique. 2 

L'un des algorithmes possibles de construction de la matrice Z: est donné 
par le théorème qui suit [19]. : 

Théorème. La matrice symétrique définie positive Z, solution de l'équa- 
tion algébrique matricielle (234) 


. S (2) = 0, 
est déterminée par la relation : 
[—Z, E] AM = 0 (29.235) 
ou par la relation équivalente 
E 
= = 2 
A (—%) [ 2. 0, (29.236) 


avec E, la matrice unité. Ici, À (I) est le polynôme dont la variable est la matrice 
M. Le polynôme scalaire correspondant À (À) est déterminé par la relation 
det (ÀE — M) — (—1)" À (À) A (—à), (29.237) 

le polynôme À (À) étant de degré n et ses zéros possédant des parties réelles négatives. 

Démonstration. Comme nous l'avons montré précédemment, la 
matrice symétrique définie positive © qui vérifie l'équation algébrique matri- 
cielle (234) existe et est unique. h 

D'après (230), à la matrice ? = Z correspond le filtre optimal décrit par 
l'équation différentielle 


= (A— È) p+ÉC*R-L (1), p (to) = 2 (29.238) 


Le filtre optimal (238) est asymptotiquement stable, c'est-à-dire la matrice 


41 A— SR (29.239) 
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est asymptotiquement stable. Désignons par A (À) le polynôme caractéristique 
de la matrice À 

A (À) = det (ÀE — À). (29.240) 
A étant une matrice asymptotiquement stable, tous les zéros du polynôme 


À (À) possèdent des parties réelles négatives. 
Désignons par 7 la matrice 


T— 0 £E 
Son inverse T1 est de la forme 
21 —$ E 
T [ LE (29.242) 


En outre, on a 


SORTIE RE 


R —(4—ŸR)* 
Puisque 
S (Ë)—0, 
conformément à (239), la matrice (243) devient 
A 0 
runr=| L |: (29.244) 
R —AÀ* 
Comme 
det (ÀE — ®) = det (ÀE — T-IMT), (29.245) 


on obtient 
ÀE — A 
—R AE+4* 
Plus haut nous avons noté (240) 
det (ÀE — A) = A (À). 


Puisque det (ÀE + A*) est le déterminant caractéristique du système 


det (AE — M) = det | | = det (ÀE — 4) det (AE + 4%). (29.246) 


È « —(A—ÈN)*E, (29.247) 
conjugué du filtre optimal (238), il vient 
det (ÀE + A*%) = (—1)7 À (—À). (29.248) 
Nous avons ainsi démontré la proposition (237) du théorème suivant laquelle 
det (ÀE — M) = (—1)7A (À) À (—À) 


et établi que A4 est déterminé par la relation (240). 
Ecrivons la matrice AM, composée en remplaçant dans le polynôme A(À) 
la variable scalaire À par la matrice carrée ?, sous la forme partitionnée 


acm=[# #7 (29.249) 
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où #, B, C, D sont des matrices nr Xn. De plus, la matrice T-1A (M) T est 
de la forme 


ruamr-[-#5] [4 5] (2 21- 


“hs loué" | (29.250) 
A#+ BE 
Puisque d'après (244) 
riur= |? 4 
R —A* 


et comme A(À) est le polynôme üäe À, on a 


a er-mm a (| À =)? : | (29.251) 


R —A* a A(—4À*) 
où a est une matrice n X n, en général non nulle. 
Etant donné que d'après (240) 


A (À) = det (ÀE — 4), 
en vertu du théorème de Hamilton-Cayley 
JA (4) = 0, (29.252) 
et ainsi la matrice (251) devient 
aime à]: (29.253) 
Constatons que d'après (248) 
det (ÀE + A%) = (—1)" A(—à): 
c'est pourquoi le théorème d’'Hamilton-Cayley conduit à 
A (—(—4*)) = A (4*) = 0. (29.254) 


Comme le filtre optimal est RéTDpIoHANemant stable, les zéros du polynôme 

A (À) reposent dans le plan de la variable complexe À strictement à gauche de 

l’axe imaginaire, c'est-à-dire A a) est un polynôme de Hurwitz. C’est uoi 

dans le polynôme A (À) les coefficients affectés aux puissances paires de ème 

qu'aux puissances impaires de À ne peuvent être nuls et on a d’après la relation 
, 


A (—4*) & 0. (29.255) 


Déduisons maintenant une relation auxiliaire. Conformément à (240), le 
polynôme scalaire A (À) est de la forme 


A (À) = AM + ani +... Hank + an. (29.256) 
Il en résulte que 
A (IR) = Mn + a Mn-I +... + an M + a Es (29.257) 


Ici E est la matrice unité, et les coefficients a, . . ., &h-1, 4 sont des scalaires. 
'après (257), la matrice T-!A (I) 7 s'écrit 


T-1A (M) T = T-IMNT + a T-IMNAIT EH ... + a, T'IMRT + a, E. 
(29.258) 
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(T-MT)? = T-IMTT-AIMT = T-IMT, 
(T-IMRT)S = T-IMTT-IMTT-IMT = T-IMT, 
(T-INT)s = T-IMT, (29.259) 
la matrice A (T-IT) est, en vertu de (257), 
A (T-IRT) = (T-1MT)N + a (T-IMT)N I +... + 
+ an-17 "IMT + a, E = 
= T-IQNT + a, T-IMNIT + ...+ an TIMT+aE. (29.260) 
Les relations (258) et (260) entraînent que 
TA (M) T = A (T-IMT). (29.261) 
C'est précisément la relation auxiliaire qui nous intéresse. 


On tire de (261), (250) et (253) que 


7e (29.262) 
€c=$4, 

d'où 
= 281= C4 (29.263) 


Les relations (262) sont équivalentes à la relation (235) donnée par le théo- 
rème. En effet, d'après (235), 


[—Ÿ$, El A (D) = 0, 
ou, d’après (249), 


in [ÉD ]=i-$ete, -S2+31=0 


ce qui coïncide précisément avec les relations (262). 
Pour justifier la relation (236) du théorème,’ on procède d'une façon analo- 
gue. Le théorème est démontré. 


$ 30. Filtrage optimal des bruits corrélés 


1. Systèmes à perturbations intercorrélées. Considérons le pro- 
blème du filtrage optimal d'un système linéaire non stationnaire 


= A(Dz+B(Ow(, 


z(t)=C(t)z(t) +v(t). (30.1) 
Ici w (t) et v (ft) sont des bruits blancs gaussiens à moyennes nulles 
M {w (t)] = 0, M [{v (t)] = 0 pour tout t. (30.2) 


A la différence des hypothèses faites dans les paragraphes pré- 
cédents, nous allons considérer que les processus aléatoires w (t) 
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et v (t) sont intercorrélés et que leurs fonctions de corrélation sont 


cov{w(t); w(t)]=M{w(t)w* (x)] =6(t— 7) Q (+), 
cov [u(t); u(t)]= M{v(t)v*(rt)] =ô(t—7T)R (+), (30.3) 
cov{w(t); v(t)]}=Mfw(t)v*(r)] =ô(t—7T)£ (+), 
où © (t) est la matrice symétrique définie non négative, et R (t) 
la matrice symétrique définie positive. 
Soit to l'instant initial ({, > —), et le vecteur zx (f,), l’état 
initial du système. Supposons que zx (£,) est une variable aléatoire 
vectorielle gaussienne non corrélée avec w (t) et v (ft) à moyenne 


M [zx (t0)] = 0. (30.4) 
Sa matrice de corrélation 
cov [x (4); x (to) = M [x (to) z* (to)] = Zo (30.5) 
est une matrice définie non négative supposée connue. 


A la différence de (28.82) et (28.80), dans ce problème, l'équation 
différentielle du filtre optimal s'écrit 


R=A(We+C(E)lz()—C (Del p()=0. (30.6) 
Ici 

GC(H=IS OC" (+B(DL£ (IR (1) (30.7) 
et Z (t) est la solution de l'équation différentielle matricielle de 
Riccati 
À = A(D + SA ({)—[2C"(H+B(DE£ (DIX 

x R(HIC (D) E+L* (Et B*(D1+ 
+B(DOQ()B*(),  Z(to) —Zo (30.8) 


Montrons que l'équation de Riccati (8) peut être ramenée à la 
forme analogue à celle de (28.80). A cet effet, introduisons les nota- 
tions suivantes 

A (= A(D—B(1)£() R°1(1)C(+), _— 
QD =Q()—£ (4) R1(E) L* (6). | 


Supposons ensuite que @ (t) est une matrice définie non négative. 
En portant dans l'équation (8) les valeurs de À (t) et Q (t), données 
par (9), on ramène l'équation (8) à la forme 


À = À (D 5 + SA (9 — 5° (0 RT(D CE + 
+B(HO()B*(), E(t)=2Z0 (30.10) 
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Conformément à (9), l'équation différentielle (6) du filtre optimal 
devient 


L(4()—25 (ECC ROC (HIe+ 
HEC OR I(D+B() LE) R1(1)]1z(0, pts) —0. (30.11) 


L'équation différentielle de Riccati (10) ne se distingue de 
(28.80) que par les paramètres À (t) et Q (f) remplacés respectivement 


par Z (1) et © (t). La correspondance est la même pour les équations 
différentielles homogènes formées à partir de (28.82) et (11) pour 
z (1) = 0. C’est pourquoi les résultats obtenus au $ 29 sur les pro- 
priétés des solutions de l'équation de Riccati (28.80) et sur la sta- 
bilité du filtre optimal concernent également notre problème. Certes, 
les fonctions À (t) et Q (t) doivent être remplacées par les fonctions 
respectives Æ (t) et Q (t). 

2. Systèmes à perturbations de mesure autres que les bruits blancs. 
Dans les sections précédentes, les filtres optimaux de Kalman-Bucy 
ont été construits pour le cas où les perturbations étaient des bruits 
blancs. La généralisation au cas où les mesures du signal de sortie 
sont entachées de bruits dus au passage du bruit blanc par un système 
linéaire non stationnaire a été étudiée par Bucy [19]. 

Examinons le système décrit par les équations vectorielles 


= A(Dr+B(w(t, z(t)=c, 
= S(}v+x(s), U (Lo) = b, (30.12) 


z(t)=Cz(t) +v(t). 


Ici z est le vecteur d'état de dimension 7 ; w (t), le vecteur de dimen- 
sion r à l’entrée du système ; À (t), la matrice z X n ; B (t), la matrice 
n Xr;%x (t), le vecteur de dimension m ; v, le vecteur de dimension 
m; S(t), la matrice m X m; z(t), le vecteur de dimension m; 
C, la matrice constante m X n. 

L'entrée w (t) est un bruit blanc gaussien à moyenne nulle 


M [w (t)] = 0 (30.13) 

et à matrice de corrélation 
cov [w (£; w (t)] = M [w (à) w% (x)] = 6 (4 — +) Q (1), (30.14) 
où Ô ({) est la fonction impulsion de Dirac et Q (t), la matrice symétri- 


que définie non négative r X r. 
Le signal x (t) est un bruit blanc gaussien à moyenne nulle 


M [x (01 = 0 (30.15) 
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et à matrice de corrélation 
covÜx (4): x (t)] = Mx (6) x* (x)] = 6 (t — +) R (+), (30.16) 


où À (t) est la matrice symétrique définie positive m X m. 

Le vecteur c est une grandeur aléatoire vectorielle gaussienne 
de dimension » indépendante de w ({), à moyenne nulle et à matrice 
de corrélation connue 


Mfc*]="r. (30.17) 


Le vecteur b est une grandeur aléatoire vectorielle gaussienne de 
dimension m indépendante de >% (t), à moyenne nulle et à matrice de 
corrélation connue 


M [bb*] = &. (30.18) 


On suppose que w (t), x(t), c et b ne soient pas corrélés. 
Désignons par x (t) l'estimation optimale de l’état xt) du 
système (12), c’est-à-dire celle qui minimise la fonctionnelle (28.24), 


d'après le vecteur fonction z (ft) accessible à la mesure dans |’ inter- 
valle de temps [léo, 7]. 


D'une façon analogue à (26.116), l'estimation optimale x (t) 
vérifie le lemme sur la projection orthogonale dans un espace de 
Hilbert, qui dans ce problème conduit à la relation 


M {{z()—z(tlz (D}=0, t,LT<t. (30.19) 

Désignons par Z(t) et % les matrices symétriques m X m 
Z ()=CB(t)Q(t)B*(t)C*+R (tu (30.20) 
U=CTC+EX. (30.21) 


Supposons dans ce qui suit que Z (ét) et % sont des matrices définies 
positives. 


Comme l'a montré Bucy [19], l'estimation optimale z(t) de 
l’état x (1) du système (12) s'écrit 
z (4) = p (t), (30.22) 
où p (t) est la solution de l'équation différentielle 


PAT (D CA(D+T (DS (D Cle+ 


+7 (0 +7 (DS (2, (20.23 
P (to) = TC*UL"12 (to). 
Nous avons désigné ici par Ÿ°(f) la matrice nr X m 


F'(t)={6(t)14 HD C°—CS(H]+B()OQ(t)B*(t)C*}ZT1(4), (30.24) 
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et par & (1), la solution de l'équation différentielle matricielle de 
Riccati 
= A()E+EA (TT 7" (0+B(EQ( B°(, (80.25) 
qui vérifie la condition initiale 

8 (to) = T — PC*UTICT = 7. (30.26) 


Dans ce problème, l'équation différentielle (23) est celle du 
filtre optimal. 


Introduisons la notation y ({) pour le vecteur fonction de dimen- 
sion ñ 


vO=6p()—T (2 (0). (30.27) 

Désignons par Æ (t) et .S” (t) les matrices mXmetmxn 
F(D=A(t)—-T DCA()+T OS Cu (30.28) 
S'(=F OT O-TOSO-T. (30.29) 


L'équation (23) du filtre optimal peut se mettre sous la forme 


Dr (br+S bz(, 
y “A = (TOUT (t5)] z (to). 


A la différence de (23), le second membre de l'équation (30) ne 
compte pas de dérivée par rapport au vecteur fonction z (t) défini 
par observation. 

Après avoir trouvé de l'équation différentielle (30) le vecteur fonc- 
tion y (ft), déterminons d’après (27) et (22) l'estimation à obtenir 
zx (t) de l’état du système 


z(t) z y) + F (0 z (0). (30.31) 


Montrons encore que l'équation de Riccati (25) peut se ramener 
à une forme analogue à celle de l'équation (28.80). A cet effet, intro- 
duisons les notations 


(30.30) 


Â(D=A()—B()Q(4)B* (CZ (1 C(, 
B(t)=B(t), C(t=CA()—S(t)C, 
Q(H=Q(H—Q()B"()C*Z"1()CB()Q(), 
R(t)=T (+). 


(30.32) 
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Remarquons que puisque Z ({) et € (1) sont des matrices symétri- 
ques, on a d’après (24) et (32) les relations suivantes: 


T'()=18()C*()+B()Q(U)B*(C*1Z"1(, (30.33) 
Ve (= ZT (IC () & (0 + CB (#) Q(t) B° (61, (30.34) 
J'OTOT(H=ELC (EH 21 C()E(E)+ 
+8 (14)C* (1) 471 (t) CB (9) Q(t) B* (t)+ 
+ B(t)Q(t) B* (4) CAE C (+) 8 (1) + 
+ B(1)Q (0 B* (D C°TT (1) CB (t) Q (+) B* (+). (30.35) 
En portant l’expression (35) dans l’équation (25), on réduit cette 
dernière à la forme 
Æ _ ne+eA (EC (0 RDC E+ 
+ B (1 Q() B* (6, E(to) =. (30.36) 
L'équation différentielle (30) du filtre optimal s'écrit en vertu 
de (33) et (32) 
=10—-8C (ROC (HIv+S Oz, (80.37) 
vo) = (TC — T° (to)] 2 (bo). 


L'équation différentielle de Riccati (36) ne se distingue de 
(28.80) que par le remplacement des paramètres À (4), B (1), C (+), 
Q(t) et R(t) par À (t), B(t), C(t), Q(t) et R(t). Cette même 
correspondance caractérise les équations différentielles homogènes 
qui se forment à partir des équations (37) et (28.82) avec z (t) = 0. 
C'est pourquoi les résultats du $ 29 s'étendent également à notre 
problème. Bien entendu, dans ces conditions, les fonctions À (+), 
B (+), C'(t), Q (#) et R (1) doivent être remplacées respectivement 


par À (t), B(t), C'(t), Q () et R (). 


$ 31. Filtrage optimal à valeurs discontinues du temps 
Considérons le système régi par les équations aux différences 
finies 
Z(ln41) = D (fn4ts fn) T (tn) HT (tn) Das n=0, 1,2, .. 
z (to) = 5; (31.1) 
Zn = Hnt (tn) +Un- 
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Ici x est le vecteur d'état de dimension n; ® (4,11, 4h), la matrice 
n Xn; l(£,), la matrice nr X r:; z,, le vecteur de dimension m; 
H,, la matrice m X n; uw, et v,, les suites vectorielles de dimension 
r et de dimension m respectivement des variables aléatoires gaussien- 
nes réciproquement indépendantes à moyennes nulles; s, la variable 
aléatoire vectorielle gaussienne de dimension r à moyenne nulle: 
de plus s, w, et v, sont réciproquement indépendantes. 

Les matrices de corrélation des suites discontinues w, et v, sont 


M [ww] = Qnônx ; 
M [unvi] = Rnônk (31.2) 
M{wnvr] =0. 


Ici Q, est la matrice symétrique définie non négative r X r; R,, 
la matrice symétrique définie positive m X m; ôhr, le symbole 
de Kronecker 


a e pour n=k 
rkT |O pour né. 


# æ . , ? e . .,e 
Désignons par z(f, | j) l'espérance mathématique conditionnelle 
de z(f,) pour Z5, Z1» + - -, 27 donnés! 


Z(inlr)=M{zx(tn)|Zos 249 secs Zjs ce Znle (31.3) 


De même que dans le cas continu ($$ 27, 28), d’après les données 
d'observation de Zo, 2j, - - +, Zn, TZ (t, | n) est la meilleure estima- 
tion quadratique moyenne de zx (#,). 

Théorème. Supposons que R, > aËE, où a > 0, et E la 


matrice unité m X m. Alors, les relations récurrentes suivantes ont 
lieu 


Z(tn#1[7) = D (éns4s n)Z (En | re), (31.4) 
Z(tnln)=2(tnln—1)+ An {2n — Hnz (tn —1), 
z (tol—1)= 2x (40) = 0, (31.5) 


An= P(tnlr—1) Ha{HnP(tnlr—1) Hi+ Rat, (31.6) 
P (tn+s]n) = D (tas tn) P (tn|r) O* (én41s tn) + T (En) QnT* (tn); (31.7) 
P(taln)={[E—AnHn] P (énlr—1)(E— AnHal* + 
+ A,RnA%= P(tnln—1)—AnHnP (tnln—1), (31.8) 
P(tol—1)=P (tr) =M{ss"}. 
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Ici : , 
P (tnlr)=M{z(tnln)z* (tn|n)], 
P(tnlr—1)=Mz(tn|r—1)z* (tr — 1) (31.9) 
Z(tn|j)= 7 (tn) —Z (tn | j). (31.10) 


Les relations récurrentes (7) et (8) entrainent que 
P (ln+a | n) = O (En+1 ln) P (4h | n — 1) D* (én+a ln) LE 
—O (En+1 ln) P (tn [nr — 1) H3 [H,P (En | n —1) H} + R;J"1 X 
X H,P (én | n — 1) O* (URST În) + 
+ DT) QT* (4), (31.11) 
P (t5 | —1) = P (t9) = M [ss*]. 


La relation (11) est une équation matricielle aux différences de Riccati. 
Cette équation se transforme en équation différentielle matricielle de 
Riccati à la limite pour t, — th —+ 

D'une façon analogue, les relations récurrentes (4) et (5) et la for- 
mule (6) impliquent que 


z (én+117) = D ({n+1s /n) z (n1r—1)+ 
+ D (n41s tn) P (nln—1) HÉ(HAP (tnlr—1) 45 + Ra! X 


X [2n—Hnt (tn|r—1)], 
z (to|—1)=2 (to) = 0. (31.12) 


La relation (12) représente une équation vectorielle aux différences 
qui décrit le filtre optimal. 

Démonstration. Considérons d’abord certaines proprié- 
tés des répartitions de probabilités conditionnelles des variables 
aléatoires vectorielles gaussiennes. 


1°. Soit k le vecteur de dimension nr + m 


k= |; J: (31.13) 


où le vecteur a de dimension nr et le vecteur b de dimension m sont des variables 
aléatoires vectorielles gaussiennes à moyennes nulles. Supposons encore que 
M {bb*] > 

RER ITAES les notations 


N = MIkk*], No = M {aa*), 


Nab = M [ab*], Npa = M [ba*], (31.14) 
No = M [bb*]. 
On a alors 
= Na Nab 
el (31.15) 
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Désignons par c le vecteur 
c=a— NaoNÿb. (31.16) 
Constatons que 
Ne=Mlec*]=M(e — NoN5b) (a — NooN5b)*] = 
= M {aa°] — M [ab*] NoNi — NobN5M [ba*] + 
+ NooN5M [bb*] NENy = 

= N,— NobNENba — NaobNE Nha + NabN5 Nbar 

ou 


Ne= Na — NobN5 Nha. (31.17) 
Cherchons maintenant 


= Na Nob 
det N = det ne. NL 


En multipliant la deuxième EDe de la matrice à gauche par la matrice 
—N,6N5'et en ajoutant les éléments de la ligne obtenue aux éléments de la 
première ligne de la matrice W, on trouve 


à No—NoN=Nye 0 
det M =det [ a no =ét( JC LE ]= 
Nra No Nba Ne 


= det (No — NobNEIN ba) det No, 
ou, d'après (17), 


det N = det N, det Np. (31.18) 
Conformément à (16), on a la transformation linéaire 
a E NooN;! c 
G]=lo » Ji] 519) 


Comme le jacobien de la transformation (19) vaut l'unité, la densité de pro- 
babilité commune des vecteurs aléatoires a et b s'écrit 


LE LL 1 ent c+venstb 
f(a, b)=(2x) “ (detN) “e ane ne, (31.20) 
La densité de probabilité du vecteur aléatoire b est 
m 1 1 1 
METE = 5 0%Ny b 
f(É)=(27) ? (detNy) 2e ? °. (31.21) 
La densité de probabilité conditionnelle du vecteur aléatoire a pour b donné: 
, d + LS _lcen- le 
f1D= = En (et Ne Te TU? 


ou, en vertu de (16), 
n 


1 1 
TT —— —<(a-N NE b)eNT lt (a N END b 
f(alb)=(2a) 2 (dt AN) 2e 207 bb te GT abtb 9) 


(31.22) 
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Il suit de la relation (22) que l’espérance mathématique conditionnelle du vec- 
teur a pour b donné s'écrit 
M{alb] = NoN5b (31.23) 
ou, d’après (14), 
M{e|b]=M{ab*] {M{[bb*]}-16. (31.24) 
Comme d’après (16) 
a—M{alb]=a—N'NS'b=e, . 
il vient 
MI(a—Mialb])(a—M{alb}) bd =Ne=Na— NobNEiNbae (31.25) 
Notons que l’indépendance de la matrice de corrélation conditionnelle (25) 
par RES à b est une propriété importante des processus aléatoires gaussiens. 
Pour d’autres processus aléatoires, cette relation a lieu, ce qui complique nette- 
ment le problème général d'estimation optimale. 


2°. Montrons maintenant l'indépendance des vecteurs aléatoires ce et b. 
D'après (16), 


M{cb*] = M {(a — NpN51b) b*] = 
= M{ab*] — N'oNSM [bb*] = No — NobNS'Ny mm 0, 
Ainsi, 
M{(a—Mlalb]l)b*] = M{cb*] = 0, (31.26) 
et, donc, les vecteurs aléatoires c = a — M [a | b] et b sont indépendants. 
3°. Soient le vecteur a de dimension n, le vecteur b de dimension m et le 


vecteur e de dimension r, variables aléatoires vectorielles gaussiennes à moyennes 
nulles; de plus, 


M {[bb*] > 0, M [ce*] > 0, M [be*] = 0, (31.27) 


Désignons par Z le vecteur de dimension (m + r) 


b 
je [ : 1 (31.28) 
Alors, d’après (24), 
M{al!]=M{al*]{Mfls]}-t1, (31.29) 
Comme M [be*]—0, il vient 
M [bb* 0 {M [bb*]}-1 0 
LIU D Dares Mer] MI ef . (eee J’ 
Mi{al*]=[M{ab*], Mae*]]. (31.30) 


Il en résulte que 
Mlal*]{M{U*]}-11—M [ab*] {M[bb*]}-1b+ M [ae*] {M{eet]}-te (31.31) 
ou, en vertu de (24) et (29), 


M{alb, e]=M{alb]tMl{ale]. (31.32) 
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Proposons-nous maintenant de démontrer le théorème. La rela- 
tion (4) se déduit de l'équation initiale (1) du fait que 


M [w,] = 0. 
Désignons par z, le vecteur 
Zn = Zn — Hnt (tnln—1). (31.33) 


Puisque d’après (3), z (4, | z — 1) n’est défini que d’après ze, Z1, . . . 
+ 2n-1 donnés et présenteune combinaison linéaire de ces vecteurs, 
on a la relation 


M{z (tn) | Zo» Zi os 2n]=M{t(in)|Zos +. 2n-1s 2nle (31.34) 
D'après (1) et (3), le vecteur Zn Se met sous la forme 
Zn = Hn {z (tn) — 2% (En 1 —1)] + Un = 
= Hn{z(tn)—M{z (fn) | Zo> Z15 +, 2n-1]} + Un. 


Comme il résulte des relations (26) et (2), les vecteurs aléatoires 
Zn @t (20, Z1, - « » Zn_1) Sont indépendants. Par suite, conformé- 


ment à (32): 
M [x (én) | Z0s - +9 Zn-1) Zn] = 
=M{z(r) 120. 2n4]+M{z(4)[Znl. (81.35) 


En vertu des relations (3), (34) et (24), la formule (35) peut 
être ramenée à la forme 


Z(talr)=z (in ln —1)+M{z (tn) |] = 
=2(tnln—1)+Miz(t) A1(Mizn2nl} t2n. (31.36) 
Si l’on tient compte que d’après (9) 
P{tnin—1)=Mfz(tnln—1)2° (tn|r—1)]. 
on obtient 
Miznz°] = HnP (tnln—1) HÈ+ Ra, (31.37) 
M{z(tn)2]=Miz(tn)z (tnln—1)]H$=P(tnln—41)AH5. (31.38) 


La formule (37) s'obtient de la façon suivante. D’après (33), (4) et (10), 
2n=Hnz(tn)+vn —Hnz(tnin—1) 
ou 


Zn = Hnz(tnir—1)+vn. (31.39) 
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On voit de (12) que z(th|n—1), et, par conséquent, z (4, |n—1), sont indé- 
pendants de z,, et donc de v,. Donc, 


=. 4 


M{znc]=M{Hnz(tnin—1)z*(tnln—1) H#}+Ml{unre], (31.40) 


d’où l’on tire précisément la formule (37). 
Pour obtenir la formule (38), notons que puisque 


M{z(tr) v71=0, 
il vient, d’après (39), 
M{z (tn) 2] =M[z (tn) 2% (tn ln —1) H9). (31.41) 
En vertu de (10), l’expression (41) devient 
M{z(n)2)=M {sn fn—1)+2(tnin—1))2% (tnin—1) H4}, 
ou 
Mlz(tn) =%]=P(tnln—1) HS+MIZ(tnln—1)2*(thln--1)) Hs. (31.42) 


En raison de la relation (27.35) qui traduit le contenu du lemme sur la projec- 
tion orthogonale, 


MIzGaln—1)2 (th ln—1)]= 0. (31.43) 
Les relations (42) et (43) conduisent à la formule (38). 
Les formules (36), (37), (38) et (33) justifient la récurrence (5)} 


our obtenir la relation récurrente (8), remarquons que d’après (10), (5) 
et (33) 


Z(tnln)=z(tn)—2(tnlr)=2(tn)—2(tnln—1)— Ann 
ou 
Zftnln)=2(tnln—1)— Ann. (31.44) 
11 en résulte que 
Mfr(tnln)z*(tnln)l= | 
=M {2 (taln—1)—Aninl{z (tn ln —1)— Anznl*} 
ou, d'après (9), 
P(tnln)=P(tnln—1)— AM fzn2* (tnln—1)]— 
—MIz(tnln—1) 2%] 4%+A4nMfns#) 4%. (31.45) 
Comme z(th|n—1) et v, sont indépendants, (39) et (9) entraînent 
AM Enr (tnln—1)1= AM [Hz (tnfn—1)2% (4, |n—1)]= 
=AHhP(taln—1), (31.46) 
Miz(tnin—1) 2%] A=M{z(thln—1) 2% (tnln—1)] H#AS = 


—P(tnln—1) H%4% (31.47) 
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D'après (37), 
AnM [5x2] 4% = A, [HnP (tn in —1) HS+ Ra) A#, 
d'où, conformément à (6), on a | 
AnM{2n2%] A9 = P (th (n—1) H%AS. (31.48) 


En portant les expressions (46), (47) et (48) dans la relation (45), on ob- 
tient la relation (8): 


P(tnln)=P(tr|n—1)— Anal (tnln—1). 


Ainsi nous avons justifié la relation récurrente (8). 


$ 32. Application de la programmation dynamique à la théorie 
de la commande optimale des systèmes stochastiques 


{. Equation différentielle stochastique d’Ito. Considérons le 
système décrit par l'équation différentielle stochastique vectorielle 
di = f(t, x)jdt +G (t, x)dw (t), b SIT. (32.1) 
Ici x est le vecteur de dimension nr ; f (4, x), le vecteur fonction de 
dimension nr; w (t), le processus séparable de Wiener de dimen- 
sion m; G(t, x), la matrice n X m. 
Puisque 
d 
= (32.2) 


est un bruit blanc gaussien de dimension m à moyenne nulle, l’équa- 
tion (1) se met quelquefois sous la forme 


= f(é 2) + (6 2) 5 (0. (32.3) 
La matrice de corrélation du processus aléatoire & (4) a pour expres- 
sion 
covi6 (4); CT) = MIE (9 E* (x)l = Q (8) 6 ( — ). (32.4) 


Ici @ (t) est la matrice symétrique définie non négative m X m; 
cette matrice peut donc se mettre sous la forme 


QG) =S (SE (1), (32.5) 


où S (t) est la matrice singulière réelle m x m. 
Introduisons les notations: 


dw (t)= S (t) dw (t), (32.6) 
G(t)=S (+) C (6). (32.7) 
L'équation (1) se met alors sous la forme 
di=f{t,z)dt+g(t,z)dw(t),  tEI<T, (32.8) 
où 
: gt, r)=G(é, »)S (+). (32.9) 
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D'une façon analogue, l'équation (3) devient 
de _,. e 
ar = 2) +g(t 2) 6 (0). (32.10) 


Ici & (t) est le bruit blanc gaussien de dimension m à moyenne nulle 
et à matrice de corrélation 


cov LE (4); 6 (t)] = M {6 (0) Ë* (x)] = E6 (t — r), (32.11) 


où E est la matrice unité m X m. 
L'équation différentielle stochastique (8) (et, par suite, l’équa- 
tion (10)), est équivalente à l'équation intégrale stochastique 


t t 
z() = z (to) + | f(t, z(t))dt + | g(t,z(r))dw(r). (32.12) 


On suppose que les fonctions f (4, x) et g(t, x) sont mesurables 
par rapport à £ et à z pour {4 €{t,, T] et vérifient les conditions 


HG + le DII<SkA+IzI),  4Elé, TI, 
HG —-fG D I+ Ie D —-se(tynII< 
<kllz—yll, t1Elé, T], 


où k est la constante correspondante. Dans l'équation (12), x (t,) est 


une variable aléatoire quelconque indépendante de dx. Sous ces 
conditions, l'équation intégrale stochastique (12) définit le processus 
stochastique unique X = {z(t); tE [t,, T]} qui est un processus 
markovien. 

2. Processus de diffusion. Formule d'intégration d’Ito. L'équa- 
tion différentielle stochastique (8) définit la famille des processus 
markoviens qui dépend du paramètre aléatoire x (f,). En général, 
nous désignerons par À un processus fixé mais pris arbitrairement 
dans cette famille. Le processus markovien X est un processus de 
diffusion. 

Soit la fonction scalaire 4 ({, x), où x est le vecteur de dimen- 
sion nr qui vérifie l'équation différentielle stochastique (8). Sup 

? dp Gp _— 921 
posons que v({,'x), TT ir” k=1,..., n, ITR 
j, k—=1,..., n, sont des fonctions continues par rapport à leurs 
variables. 

Désignons par w. le vecteur de dimension n 


0/07: 
pe=| -.. |, (32.13) 
_OVOzn_ 
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et par %.., la matrice symétrique r X nr 
2 * 0% 92 
Oz? | Ori 0ze © OZ Ôzn 
Vis ssssei se eaies | (32.14) 
24 9% h 924 


ôz10zn Ôt20zn ‘‘ Oz 
Désignons par © (f, x) la matrice nr xXn 
ot, r)=£gi(t, z)g* (1, x). (32.15) 
La relation auxiliaire 


LD Dont) = À Splet (é x) baxg (t 2)] (82.16) 


ei Oz} 0zh 
se déduit du fait que d’après (41.50) et (15) 
Sp [g* (£, z) bg (f, z)] = Sp [b:xg (, x) g° (é, x)] = 
= Sp{Wb::0 (f, r)]=Splo(f, r)bzxl. (32.17) 
Comme d’après (41.50), (9) et (5), 
Sp[g° (£, 2) bzxg (t, z)] = Splbrxg (4, x) 8° (E, z)] = 
= Sp{h:.G (f, x) S (4) S° (4) G° (4, x)] = 
= Splh:kG (£, z)Q(1)G*(£, z)], (32.18) 


la relation (16) devient 


LS D on 2) = À SptpesG (E, 2)Q ()G°( 2) (82.19) 


J=1 Rk=i 


On sait [49] que l'opérateur infinitésimal %® du processus 
markovien aléatoire X, défini par l'équation intégrale stochasti- 


que (12), est de la forme D = Z + 2 , Où l'opérateur Z peut 
être déterminé à l’aide de la relation 
n n 
1 0? 
LV, =5 D D om (e, 2) ti (tx) (32.20) 
j=i k=! 
où la matrice o (t) du type nr X nr et le vecteur 1. de dimension nr 


sont déterminés par les expressions (15) et (13). 
Conformément à (16), on a pour l'expression (20), 


Lt 2)= 5 Sple* (tb z)baxg(ts 2)]+f" (6 2) be (82.21) 
ou, d’après (19), 
LL z)= 7 SplhG (4 2) Q (0 G' (4 2)]+ ft z)b. (32.22) 


454 SYSTEMES STOCHASTIQUES [CH .6 


De plus, comme l’a montré Ito [25], 


t 
dé, z(t))=v(s, x (s)) + | db(t, z(t)) pour {>s, (32.23) 


où dy est la différentielle stochastique d’Ito de la forme 


di (x, 2 (9) = LE (x, 2 (9) + be (x, z (HI dr + 


+ 5 (rt, x (r)) g (rt, x (r)) dw (rt). (32.24) 
Ici 


pe), (32.25) 


On en déduit la formule d'intégration d’Ito [25], 
M. .[lb(é, x(t))] = 


t 
= (s, 2)+ Mes { | LL (x, rt) (r, r(D)] dt} . (32.26) 


N 


Le symbole M,.. désigne ici l'espérance mathématique sous la 
condition qu'à l'instant s le processus markovien x (t) «sort» du 
point x. 

3. Commande optimale des systèmes stochastiques. Equation de 
Bellman. Considérons le système commandé décrit par l'équation 
différentielle stochastique 


dr={A(t)}x+ L(tju]dt+g(t.r)dw(t). x(to)=z%o. (32.27) 


Ici x est le vecteur de dimension 7 ; À (ft), la matrice rn X n;u, le 
vecteur de commande de dimension p; L(t), la matrice nr X p; 


w (t), le processus séparable de Wiener de dimension m défini dans 
ce qui précède par la relation (6) ; g (f, x), la matrice rn X m définie 
par la relation (9). 

On demande de choisir la commande « telle qu'elle minimise 
la fonctionnelle 


T 
J()=M{b(T,z(T)+| AGz(). u(D)dt], (32.28) 


où A({, zx, u) est une fonction scalaire positive de ses variables. 
La grandeur 7 est fixée ; la valeur de x (7) n’est pas fixée à l'avance. 
Nous avons donc un problème à extrémité libre de trajectoire et 
à temps fixé. 
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Désignons par % la classe des fonctions o (f, x) qui jouissent 
des propriétés suivantes: œ ({, x) est continue par morceaux par 
rapport à { pour tout x fixé, 


Ip DU <k(+I!z I), (6 x) € ltosTI X R* (32.29) 
et ® (t, x) satisfait uniformément à la condition de Lipschitz par 
rapport à x dans [t,, 7] x R". 

Considérons comme admissibles les commandes 


u (1) = q (6, z (t)) (32.30) 
et notons-les u € 4. 


Supposons également que x, est un vecteur constant (non aléa- 
toire). 

Sous les conditions qui viennent d'être énoncées, l’équation 
différentielle stochastique (27) définit dans l'intervalle (4,, T) le 
processus de diffusion X,. ‘L'opérateur différentiel Z,, de ce processus 
se définit, d'une façon analogue à (21), par la relation 


LaV (1, 2) = 5 Sple* (2) Vasg(t, 2) + 
+ [4 ()z+L()ul*V,, (32.31) 


où u doit être remplacée par (£, x). 
Lemme. Supposons qu'il existe une commande q° (t, x) et une 
fonction scalaire V (t, x), 1 Ets, T] qui jouissent des propriétés: 
4°. V, V,,' V,, V.. sont continues. 
2. Pour tout x et tout tElto T} 


O=V,(t, r)+ LooV (4, z)HA(E, x, QUE, x)), (32.32) 
OZVi (4, x) + LoV (4, z) + A(E x, u). (32.33) 
3°. Pour t =T, 


V(T,z(T) = b(T, z(T)). (32.34) 


Alors la commande u° = @° (t, x) est optimale. 
Démonstration. Soient @ une commande admissible 


arbitraire et x (£) et x° (t), les trajectoires des processus X, et X40 
respectivement. 


La formule d'intégration d’Ito (26) devient alors 
Mi..[V(T,x(T))]= 


T 


= V(E 2) + M. | LLeV (x 2 (0) + Vi(r z (mdr } . (83.35) 
Î 
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Puisque d’après (34), V (T, x (T)) = b(T, z (T)), les conditions 
(32) étant remplies, la relation (35) s'écrit 


T 
V(t,z)= —M,,,{ | [Lo V (t,2° (t)) + V(x;z0 (t))]dt — db (T° (T))} = 


T 
=Mz[0(T, 2 (7) + | A (rs 2 (1)), gr, 2 (9) dr]. (82.36) 


D'une façon analogue, lorsque la condition (33) est remplie, la 
relation (35) devient 


T 
VA a)= Ms { À (So (x, 2 (0) + Ver (r))dr— 


Ù T 
—D(T,z(T))}SMex[b(T, z(T)) + | Am zx), p{, z(r))dr]. 


(32.37) 


En posant dans les relations (36) et (37) t = ?,, x= x, on obtient, 
conformément à (28), la relation 


V (toto) = J (U) L J (u). (32.38) 


Il résulte de (38) que la commande u° = œ? (t, x) vérifiant 
les conditions (32), (33) et (34) est optimale. Le lemme est démontré. 

Les conditions (32) et (33) peuvent être réunies pour composer 
l'équation 


min [D + LV (4, 2)+ A(4, 7, u)]=0. (32.39) 


La condition aux limites de l’équation (39) est la condition (34) 
V(T, z(T)) = b (T, z (T)). 

L'équation (39) est une équation fonctionnelle de programmation 
dynamique dite équation de Bellman. 

4. Commande optimale avec information complète sur l'état 
du système. Système linéaire stochastique à critère quadratique de 
performance." Considérons le système linéaire décrit par l'équation 
différentielle stochastique 

dr = (4 ()z+ Lt) ul dt + g (+) dw (), (32.40) 
où, d’après (9) et (5), 

gH=GEÉS(t, SOS =Q(0 
et Q(t) est une matrice symétrique définie non négative. 
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On demande de choisir une commande uw telle qu'elle minimise la 
fonctionnelle (28), avec 


b(T, T)) = z* Fz(T 
AC (4, “ pe = 2 Fa - Den (t) u. (32.41) 


Ici l'(£) et F sont des matrices symétriques définies non négatives, 


et V(t), la matrice symétrique définie positive. 
L'équation de Bellman (39) du problème considéré s'écrit 


min {2 + 5 Sp [Vax6 (4) Q (#) G°(D1+ 
+[4A(G)z+L(tbu} V.+zT(t)z+utN(tju } = 0, (32.42) 


En désignant par 4 la fonction entre accolades de l'expression 
(42), on a 


Dr = all (t)u]° V;+u®N (t)u} = 
= À (Lu, Va+(u, N (D 0)} (82.43) 
et, donc, 
Fe, E > Las (+) _ — +2 3 N ju (®) uy. (32.44) 
Ainsi, 
| OS /Ou, 
i L L°()Vx+2N (+) u. (32.45) 
SE ou, 


D'après (45), la condition nécessaire pour assurer l’extrémum de la 
fonction ÆZ(u) 


2 = 0 (32.46) 
devient 
L*(t)V;.+2N (tju=0, (32.47) 
d’où ; 
u= — N()L*(E) V.(E x). (32.48) 
Puisque d’après (44) 
ER ON, (0, (32.49) 


du; Ouy 
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la matrice 
0% 2% 
oui du, OU; 
nr Da de — 2N (t), (32.50) 
d2< 2? 


Quy dun Ou? 


et comme nous l'avons dit plus haut, N (t) est une matrice définie 
positive. Ainsi, la commande v définie par l'expression (48) minimise 
la fonction &£ et, par conséquent, c'est une commande optimale. 

En remplaçant dans l'équation fonctionnelle (42) u par son 
expression (48) on obtient l'équation aux dérivées partielles dont 
la solution est recherchée sous la forme 


V{t,r =2P(br+p( (32.51) 


avec P (2), la matrice symétrique n X net p (t), la fonction scalaire. 
D'après (51), on a 


92} 
En 25 Pjx(t)zn, PET —— = 2P;, (1) (32.52) 
et donc, 
V, = 2P (t)z, V,, = 2P (b). (32.53) 
L'expression (48) peut maintenant se mettre sous la forme 
u = —N"t(t) L*(t P (bd x. (32.54) 
Dans ces conditions, l'équation (42) devient 
dP , à , 
ge FO 74 AN + Sp[P (4) G (4) Q (4) G* (0)1+ 


L21A( al" Pr" P(t) LH N° (t)L'() P(z+ 
+z*T(t)iz=0. (32.55) 


Etant donné que par hypothèse P (f) est une matrice symétrique, 
on a l'identite 


2 (Az, Pr) — (x, A*Pz) + (x, PAzx). (32.56) 
D'après (56), l'équation (55) s'écrit 


€, [+40 P0+P (AG 
— P (+) L(t) N° (+) L° EP (D+T(D1z)+ 
+ OL Sp(P(HG(HQ(G"(H1=0. (32.57) 
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Pour que l'équation (57) soit identiquement vérifiée par rapport 
à x et pour que la condition aux limites (34) soit remplie, il suffit 
d'observer les conditions 


<— = — A*(t) P— PA (t) + 
+PL(DNA()L' (HDP(D—T()=0  P(T)=F, (32.58) 
T 

p()= | Sp{P (x) GC (HO (D G* (HI dr. (32.59) 


L'équation (58) est une équation différentielle matricielle de Riccati. 
Comme les matrices V, let F intervenant dans cette équation sont 
symétriques, en transposant les deux membres de (58) on obtient 
pour la matrice P* l'équation différentielle dont le second membre 
et la condition aux limites sont les mêmes que dans l’équation (58). 
Par suite, P (t) — P* (t), c'est-à-dire la matrice P (£) est symétrique, 
ce que nous avons supposé dans l'expression (1). 

Sous la forme explicite, la commande optimale uw s'obtient en 
substituant à P (t) dans l'expression (54) la solution de l'équation 
différentielle matricielle de Riccati (58). 

La valeur minimale de la fonctionnelle 


T 
J(t.x)= M {r° (T) Fz(T)+ | LT (Dr +uN (rujdr} (32.60) 
{ 


fournie par la commande optimale (54) est définie par l'expression 
(51) en remplaçant P (t) et p (t) conformément à (58) et (59). 


$ 33. Commande optimale des systèmes stochastiques 
avec information incomplète sur l’état du système. 
Systèmes stochastiques linéaires à critère quadratique 
de performance. Théorème de séparation 


Considérons le système décrit par l'équation différentielle vecto- 
rielle 


= A(Dr+L(tu(t)+B()w(t. (33.1) 


Ici x est le vecteur d’état de dimension n; À (t), la matricen X n; 
u (t), le vecteur de commande de dimension p; L(t), la matrice 
n X p; w (t), le processus aléatoire vectoriel de dimension r; B (+), 
la matrice r Xr. 

Des mesures permettent de déterminer le vecteur z de dimension 
m défini par la relation 


2() = C()z() + v(), (33.2) 
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où C (4) est la matrice m X n; v (t), le processus aléatoire vectoriel 
de dimension m. 

Les processus aléatoires w (t) et v (t) sont des bruits blancs gaus- 
siens à moyennes nulles. Leurs matrices de corrélation sont 


cov [w (t); w (t)] = M [w (4) w* (x)] = Q (t) 6 (t — tv), 

cov [v (6); v (x)] = M Iv (ft) v* (x)] = R (4) 8 (t — v), 

cov {w (t); v (t)] = M [w (t) v* (x)] = 0, (33.3) 
où Ô (t) est la fonction impulsion de Dirac ; Q (t), la matrice symétri- 
que définie non négative r X r; R (t), la matrice symétrique définie 
positive m x m. 


Nous supposons que zx(f,) soit un vecteur aléatoire gaussien 
de dimension r à moyenne 


M [zx (to)] = Zo (33.4) 
et à matrice de corrélation 
M {{z (to) — 20] [x (to) — 20" } = Zo; (33.5) 


de plus, Z, est la matrice définie non négative qu’on suppose connue. 
En outre, on suppose que w (t), v(t) et x (t,) sont non corrélés. 

La classe des commandes admissibles u, (t), j = 1, ..., p est 
donnée ci-dessous (13). La commande  (t) doit être choisie de façon 
à minimiser la fonctionnelle 


J= hi GT): Sie (+ 


Hilo Q)z (+6) Ri(s)u(s)ds}. (33.6) 
lo 


Ici 7 est un instant fixé. Le but de la commande est de maintenir 
les moyennes des coordonnées de phase du système z; (£), j = 1, ..., 
..., À au voisinage du zéro, c'est-à-dire notre problème consiste 
à assurer la régulation de l’état du système. On suppose que S, 
et Q, (t) sont des matrices symétriques non négatives n X n,et AR, (1), 
la matrice symétrique définie positive p X p. 

De même qu'au $ 28 désignons par zx (t) l’estimation optimale 
au sens du critère (28.24) de l’état x (4) du système (1) définie à partir 
des mesures (2) dans l'intervalle de temps (4,, t). Désignons par 
x (t) l'erreur d'estimation 


rt) =z(t) —zx(t. (33.7) 


Introduisons la notation Z (f) pour la matrice de corrélation de 
l'erreur d'estimation 


SE (D =MIiz(t) x (t)]. (33.8) 
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Théorème 1. Pour des commandes sans prédiction, c'est-à-dire 
définies par les valeurs de la fonction z (rt) sur l'intervalle t, << T<t, 


l'estimation optimale z (t) de l’état x (t) du système (1) est une solution 
de l'équation différentielle vectorielle 


= A()E+L(u(+E (0 C°( RE (E) (2 ()—C (2), 
Z (to) = To (33.9) 
où ZE (t) est la solution de l'équation différentielle matricielle de Riccati 


£ . : , 
F=A(WE+SA (4)—2C* (4) RT1(#)C(t) 2 + 


+B (+) Q(E) B°(+), Z (to) = Zoe (33.10) 


Démonstration. En plus du système (1), considérons 
le système auxiliaire 


À = A(DE+B(Dw(t), 


(33.11) 
()=C(DE (+0 (0, 


où 
E(to)=z(t); MIE (t)]= To 
M {[E (to) — zo] LE (to — 2ol*} = 20. 


Pour le système (11) le problème de filtrage a été exploré $$ 27-29. 
Les équations (1) et (11) entraînent que 


z(t)=E()+ | O(t, s)L(s)u(s)ds. (33.12) 
to 


Bornons-nous aux commandes u (t) déterminées par les valeurs 
du vecteur fonction z (t) sur l'intervalle #4, < t < t, c’est-à-dire 
adoptons que 


u(t)=u(t, z(t)), tTElto, t]. (33.13) 


Dans ce cas bien que d’après (2) la commande uw (t) constitue un 
processus aléatoire, la valeur concrète de sa réalisation à l'instant t 
est connue. C’est pourquoi on a la relation 


{ 
2()=È()+ | O(t, s)L(s)u(s)ds. (33.14): 
to 


La fonction Ë (t) étant solution du problème de filtrage optimal 
étudié aux $$ 27-29, elle vérifie l'équation différentielle 


À A(DÈ+ 2 (0 "(D RD (D—C (DEL, E(to)=%0, (33.15) 
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où Z (t) est solution de l’équation différentielle matricielle de Ric- 
cati (10). 

En dérivant par rapport à t les deux membres de l’équation (14) 
et en retenant que 


LE O(t, s)= 0 9-1 (5) 4 (0 ( 8-1 (5)= A(D DE, s), 


l 
O(LD=E, À | D(t, s)L(s)u(s)ds=— 
lo 


{ 
= A( | O(E s)L(s)u(s)ds+@(8, 1) L(u (= 
to 


= A(t)(z()—6Ë()]+L(t)u(s), (33.16) 
on a 
= HA (DL —É(OI+L (Du (e); 


ou, d’après (15), 
= A(D 2 + L(t)u (+ (6) C* (OR (HG (6) — C(H ËL, 


Ë (to) = 20, (33.17) 
avec Z (t), solution de l'équation de Riccati (10). 
(13) et (14) entraînent que 


r—r=t— EË. (33.18) 
Donc, À 


E()—C(DE = C() (E — À) + v (0 = : 
= C(D(z—-2)+v(b =z(D —C(t zx. (33.19) 


Constatons encore que d’après (14), 


z (£o) = Ë (£o)- (33.20) 


Ainsi, l'équation (17) se met sous la forme (9) 
=A()T+L(Du(+E() C* () R°1 (4) [z (4) —C (6) 7], 


Z (to) = 20, 
où Zi) est solution de l'équation différentielle matricielle de 
Riccati (10). Le théorème est démontré. 
Lemme 1. La fonctionnelle 
Je D=M {TT Se(Th+ 
T 


+3 Lez (s), Q(s)z(9))+(u(s), Ri(s)u(shlds} (83.21) 
t 
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peut être mise sous la forme 


Ja D=MÉT GT), S2(T)+ 


LE sé LE(S), Q(s)2 (+ (8), Ri(s) u(s))]ds } + 
t 


+R SPISE(T : So be À SpIQi(s) ES (s; So dl) ds. 


T 
t 
Démonstration. D’après (7), 


rt =2z(D +z(t). 


Donc, 
M{{z(s), Q(s)z(s))] = 
=M{{z* (s) +2" (s)]Qi(s) x (s) + Qi (s)z(s)1} = 
=M{z"(s)Q(s)z(s)1+ M {z* (s) Qi(s)z(s)1+ 
+ M {2° (s) Qi (s) z (s)1 + M{z* (5) Qi (s) z (s)]. 
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(33.22) 


(33.23) 


Remarquons que puisque @, est une matrice symétrique, on a 


l'identité 
TV Qz — (Qix)* x = (Quiz, 2) 7 {r, Quiz = LV Qiz. 
Comme 
2" (s)z(s)=Sp{z(s)z" (s)], MI{z* (s)Qi(s) z(s)] = 
= M{Sp[Q(s)z(s) z° (s)}}= Sp{Qi(s) MZ (s) z* (s)]} 
et, d'après (27.35), 
M [x (s) z* (s)] = 0, 
il vient 
M{z* (s)Qi(s)z(s)]=Mt{z" (s)Qi(s)z(s)})=0, 
et la relation (23) s'écrit 
Mltz(s), Q (sx (s))1 = Mlz* (5) Q, (s) x (s)] + : 
+ MIz® (s) Q, (s) z (s)l. 


D'une façon analogue à (24), on a la relation 


M [z* (s) Qi (s) x (s)] = Sp {Q, (s) M [x (s) z* (s)]}, 


qui, conformément à (8) et (10), devient 
M [z% (s) Qi (9) z (s)1 = Sp [Qi (s) (5; Zo, to). 


(33.24) 


(33.25) 


(33.26) 
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Ainsi, en vertu de (25) et (26), on a 


MItG(s), Ql(sz(s)) =MItZ(s). Q(s) z(s))] + 

+Sp [Q (s) Z (53 Zo tole (33.27) 
D'une façon analogue à (27), 
MIG&(T), Sax (7) H=MI@(T), Siz (T))] + 

+ Sp [SZ (T; Zo to)l. (33.28) 


Les relations (27) et (28) justifient l'expression (22). Le lemme 
est démontré. 


Théorème2 (théorèmede séparation). Dans 
le système décrit par les équations (1) et (2) 


À =A()z+L(Hu()+B(bw(t), 
z(t)=C(t)z(t)+v(e), 
la commande optimale u° (t) minimisant la fonctionnelle (6) 
J=M{TS (UT), Six (Th+ 


T 
+5 Ÿ Les), Qu(s) 2 (9) +28), Ris) u (91 ds} 
Lo 
est de la forme 
u° (4) = —R;t (4) L* (+) K (D) z(t; zo to), (33.29) 
où |K (4) est solution de l'équation différentielle matricielle de Riccati 
= —KA()—A"() K+ KL (0) R:t(e) L* (9) K—Qi(b), 
K (7) = S 4e (33.30) 
Ici xt: Lo: to) est solution de l'équation différentielle vectorielle 
CA (DEL (Du (+2 (D C° (DR (D 120) —C (D ZI, 
Z(tb)=7 (33.31) 
et ZY(t), solution de l'équation différentielle matricielle de Riccati 
JE LL A(DE+ZA*(—EC* (D R1(H C (EE + 


dt 
+ B(t)0Q(E) B*(+t), Z (to) = 20- (33.32) 
Dans ces conditions la valeur minimale de la fonctionnelle 


Je D=M{StUT), Sir(T))+ 


T 
+2 le(s) Qts)z()+u(s), R(u(syds} (83.33) 


$ 33] COMMANDE AVEC INFORMATION INCOMPLÈTE 465 


ou de la fonctionnelle équivalente (22) est 
m2 | x PA / 
JT D=5{&0, K()2())+ 


T 


+ | Sp [2 (s) C* (s) R-1(s) C'(s) Z (s) K (s)] ds + 


t 


T 
+SpISIZ (Ti Zo 40)]+ | Sp IQ (s) 2 (5; Zo, t)1ds}. (83.34) 
{ 


Démonstration. En tenant compte de l'expression (22) 
de la fonctionnelle minimisée, l'équation de Bellman peut se mettre 
sous la forme: 


2 - min {+0 Q(2()+ 
+5 Sp Qi (9 E (6; Dos to)]+ + (us Ra()u)+ 
+(A()Z(0, grad J(z, 1) +(L( us grad J'(z, t))+ 
R _ Sp{2(t)C*(t) R()C()Z() S° (0) } » (33.35) 


où 
O2] ÉLYA 02] 
(02?  Oi10%e " Ô740ën 
J'H=l........ cree . (33.36) 
92 o2J 62] 
_Uin dE dinde  Ô7 


D'après (22) et (30), la condition aux limites de l'équation (35) est 
TT) T=+ (UT), Si (Th = 


= + (4 (T), K(T)2(T) +5 SpIZ(T ; Zorto) K (TI. (33.37) 


L'équation de Bellman (35) peut s’obtenir de la façon suivante. Dans le 
problème en question on demande de minimiser la fonctionnelle (22) ; on entend 


par état du système le vecteur fonction 3 (t) défini par l'équation différentielle 
stochastique (9). 


En désignant d'après (28.10) et (28.96) 


X(G@)=2(1) —C(t) z (1) 
et en tenant compte de ce que d’après (28.79) 

G()=Z2(t) C* (D R-1(+) 
on peut récrire l'équation (9) sous la forme 


dz à 2 : 
= A(t)z+L(t}u(t)+G(t)x (1), 7 (to) =%0. 


30—0393 
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Nous avons montré précédemment (28.112) que le processus aléatoire % (4) est 
un bruit blanc gaussien à moyenne nulle et à matrice de corrélation 


cov [y (#)5 x (7) = M [x (4) x° (= R (+) 8 ( — ). 
où de est la matrice symétrique définie positive qui fait partie de l’expres- 
sion (3). 
Conformément à (32.21), l'opérateur différentiel Z, du processus aléatoire 
markovien zx (t) se définit à l’aide de la relation 
LT, = 2 Sp(T: 2(4, 2 G (0 À (9 G° (1 + 
+ (4 (2 + L(t)ul, grad J (7, t)). 


L'équation de Bellman du problème de minimisation de la fonctionnelle (22) 
est de la forme (32.39) 


ô] (t, z RE” " 
minf + 2,7, D4+A (6, 2 010 
u 
où A (4, x, u) est la fonction sous le signe somme de la fonctionnelle (22) : 
« A Le. # 1 1 2 
À (+, zu) = À {z(t), Q1 (t) z(t)) + (u, Ri(t)u)+ 5 SPIQr(?) E (t5Zo to)l]. 


D'après (36), : k 
Je (2) = SN (+). 


Comme #° (t) est une matrice symétrique, on a la relation 
Sp (7. - (4, 3) G (4) R (9 G° (91 = 


= Sp(S (1 2 (HEC (HR LH RG) RA()C (1) Z (t)] = 
= Sp{Z () CHR (G)C(H)E(E) SN ()]. 


Ainsi, dans le problème considéré, l'équation de Bellman se met sous la forme (35). 
En désignant 
SET (E(), Qt) 20) + SPIQ (NE 3 or to)]+ 

+ Lu, Rilt)u)+(4(:) 3 (#), grad J'(z, 1))+ 


+(L(t)u, grad J'(z, t)}+ 
++SplZ (D C*() RDC (HZ (DS (1, (83.38) 


on trouve la valeur de u qui minimise la fonction 57. Puisque 


P a A 
ôJ : 
_ — > (Riz + > Lu 9 j=1,..., p, (33.39) 


ou; 
l=1 k=1 
les conditions nécessaires de l’extrémum 
PE = 0, j=1, ..s P (33.40) 


ou; 
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deviennent 
S uu= — 3 Las = j=1, +.) D. (33.41) 
k=! 


Le : équations scalaires (41) est équivalent à l’équation 
vectorielle 


R (but) = —L* (+) grad J'(z, ?. (33.42) 


Comme À, (t) est la matrice définie positive, l'équation (42) implique 
que la commande w(t) extrémisant la fonction éZ soit de la forme 


u(t)= —R;t (6) L* (t) grad J (x, t). (33 43) 
D'après (39) 
02% | 
EPFETTS = (Ri)jns JD k=1, | (33.44) 


et, par conséquent, la matrice nr X n dont les éléments sont 
0'SLIdu;0u,, j, k = 1, ..., r est définie positive. Ainsi, la com- 
mande w (t) déterminée par l'expression (43) minimise la fonction 4. 

Montrons maintenant que la solution de l'équation de Bellman 


(35) s'écrit (34): 
TG D=560, KO 2()+ 


++ Î Sp[Z(s)C*(s) R-t(s)C(s) Z (5) K (s)] ds + 
{ 


++ Sp IE (T5; 20 do) À (TI++ JET TE Sos o)] ds 


où À (t) est la matrice n X nr, solution de l'équation de Riccati (30). 
L'expression (34) conduit à 


grad J (x, t)=K(t)z(t). (33.45) 
En outre, la commande optimale u° (t) est d’après (43) 
u° (4) = —Rit(t) L* (t) K (t) x (b). (33.46) 
En vertu de (34), 
NS 33.41 
Ézyôz,  ** (33.41) 
et, par suite, 
NW ()=K (1). (33.48) 


30% 
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Il résulte de (34) que 
ôT(Z,t)__ 1 =, dK - 
tt 27 & 


—— Sp[Z (4 C*() R71(t)C (t) Z (6) K (t)]— 


— À Sp IQ (+) Z (6; Dos t)le (33.49) 
L'expression (30) donne 
+ rs 2 (—KA—AK+KLROL*K—Q)3= 
= + z°KAZ — £ z'A*Kz + 
+5 2KLREL'Kz—+2"Quz. (33.50) 
Comme X est une matrice symétrique, l'expression (50) devient 
14 =, dk 


- > en 12 rem 1h: 
T2 I — (Az, Kz)+ 2° KLRY'L Kz—-zx Qur. (33.51) 


Il résulte de (51) et (49) que 
RCACUPRTES K2)—+ z*K(t)L(e) RD) L'() K (D z+ 
++ Sp LE (6) C* (8) R° (6) C (t) Z (6) K ()I+ 
+5 Q()2+ 7 SplQi (9 E (6; Do, to)]. (83.52) 


Si l’on porte d’après (46) dans le second membre de l'équation de 
Bellman (35) la valeur optimale u° (+) 


u° (#) = —R;" () L* (+) K (9 z, 
on obtient l'expression qui représente min &Z, où é£ est de la forme 
uw 


(4). Cette expression s'écrit 
min GE = FL (2, Qi (2)+7 SPIQ(#) E (43 To to] + 
+ (Az, Ki)—+2"K ()L(t) RH) L'(D K() z+ 
++SpiZ()C* OR (HC(HE()EK(E]. (33.53) 
Les expressions (52) et (53) coïncident, et par suite, l'équation de 


Bellman (35) est vérifiée, c’est-à-dire l'expression (34) est en effet 
solution de l'équation de Bellman (35) Le théorème est démontré. 
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$ 34. Commande optimale des systèmes stochastiques discontinus 


1. Systèmes linéaires à critère quadratique de performance avec 
information complète sur l'état du système. Considérons le système 
décrit par l'équation vectorielle aux différences finies 


TZ (inta) = OO (tas Ên) Z (tn) + L (a) un + TV (En) Wn, 
n=0,1, 2.4 æ()=Ss (34.1) 


Ici x est le vecteur d'état de dimension n; Of(t,:,, f,), la matrice 
n Xn; Lit,), la matrice r X p; u,, le vecteur de commande de 
dimension p; l'(f,), la matrice nr X r; w,, la suite vectorielle de 
dimension r des variables aléatoires gaussiennes réciproquement 
indépendantes à moyenne nulle. 

La matrice de corrélation de la suite discontinue w, s'écrit 


M [w, wi ] —_ Qnônk (34.2) 


où @, est la matrice symétrique définie non négative r X r, et 
ôhx, le symbole de Kronecker 


ÿ = | 1 pour n-=k; 
is 0 pour n=£k. 


Désigné par s, le vecteur aléatoire gaussien de dimension nr 
à moyenne 


M fs] = pu (34.3) 
et à matrice de corrélation 


Ml(s— pu) (s — u)*] = P (to). (34.4) 
Ici P (t) est la matrice définie non négative 7 X nr supposée connue. 
On suppose de plus que w (t) et s sont non corrélés. 


La commande u, (nr = 0, 1, ..., N — 1) doit être choisie de 
façon à minimiser la fonctionnelle 


J =M [{x (En) FT (£w)) + 
N—1 


+ 2 [(x (En); Max (£n)) + (Un: Jnun)]}- (34.5) 


Ici V est fixé, c’est-à-dire {, est un instant fixé. Le but de la com- 
mande est de maintenir les valeurs moyennes des coordonnées de 
phase du système zx, (4) près du zéro, c'est-à-dire le,problème con- 
siste à assurer la régulation de l’état du système. On suppose que 
F et Yh sont des matrices symétriques définies non négatives 
n X n, et NN, la matrice symétrique définie positive p X p. 
Théorème 1. Pour les commandes admissibles u,, fonctions 
de x(!x) et t,, la commande optimale u*, c'est-à-dire la commande 
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minimisant la fonctionnelle (5), est 
un = —® (ln) x (£n), (34.6) 
où la matrice 8 (t,) du type p X n est de la forme 
À (tn) = [Mn + L° (En) P (En+1) L (En)? L* (En) Ÿ (En+1) D (En+15 fn). 
(34.7) 
La matrice # (t,) de type n X n faisant partie de l'expression (7) 
est définie par la relation récurrente 
C4 (£h) = Q" (En+1 in) Ÿ (tn+1) D (Ën+1 tn) + Mn — 
— B° (tn) (n + L° (En) # (En+1) L (En)] P (tn) = 
= [D (ln, ên) —L (tn) P (En)]" P (tn41) D (En+1s En) Mn - 
= (D (En+1s ên) —L (En) P{n)]° P (£n+1) (D (En+1s fn) 
— L(in) 8 (n)]+ 8° (En) Ra (In) + Mn (34.8) 
et par la condition à l'instant t, 


Ÿ (in) = Fe (34.9) 
La valeur minimale de la fonctionnelle (5) s'écrit 


min J=p*"®Ÿ (to) n + Sp [® (Co) P (£o)1 + 
N-1 
+ 2 SpIT* (6) (En) T (En) Qn]. (84-10) 


Quelques remarques préliminaires. Avant de passer 
à la démonstration du théorème 1, examinons quelques problèmes auxiliaires. 
1°. Soient x € X et y € V des variables aléatoires scalaires sur un espace de 
probabilité, 
Adoptons comme commandes admissibles u les commandes appartenant à 
l'ensemble U : 
u E U. 


Soit une fonction scalaire positive 
l=[L(z, y, u). 
Adoptons comme critère de performance 
MI (x, y, u), 
l'espérance mathématique d'après la distribution commune des variables 
aléatoires z et y. 
Supposons que 
min Ml(z, y, u) 
u(x, y) 
est le minimum de M{(z, y, u) sur l’ensemble des commandes admissibles 
u E U. Alors on a le lemme suivant. 
Lemme 1. Supposons que la fonction scalaire ! (x, y, u) possède un mini- 


mum unique sur l'ensemble des u € U pour tout x € X et tout y € Y. Soit w° (x, y) 
la valeur de u qui réalise ce minimum. Alors 


min Ml(z, y, u)=Ml(z, y, u0 (x, y))=Mminl(z, y, u). (34.11) 


u(x, y) u 
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Démonstration du lemme. Par condition, pour tout u € U 
on a 


lo y u)>l(z y, W(z, y)) = minl(x, y, u). (34.12) 
Par conséquent, . 
Ml(z, you) > Ml(z, y, u°(z, y) = Mminl(z, y, u). (34.13) 


u 
En minimisant par rapport à & (où u € U) le premier membre de l'inégalité (13), 
on a 


min Ml(z, y, u)> Mix, y, u0(x, y))=Mminl(z, y, u). (34.14) 


u(x, y) u 
Puisque u® (z, y) E U, on obtient l'inégalité 
MI(z, y, u0(z, y))> min Ml(x,y,u). (34.15) 
u(x, y) 


La comparaison des inégalités (14) et (15) conduit à la relation (11); 
min Ml(z, y, u)—Mli(z, y, u0(x, y))=Mminli(z, y, u). 
u(x, y) u 
Le lemme est démontré 
Constatons que l'opération min Z (x, y, u) détermine u comme une fonc- 


u 

tion de z et y et que le lemme démontré affirme que la minimisation sur l'ensem- 
ble U et le calcul de l'espérance mathématique d'après la distribution commune 
des variables aléatoires z et y sont commutatifs 

2°. SHpporons, de même que précédemment, que z € X et y € Y sont des 
variables aléatoires scalaires définies dans un espace de probabilité. Pourtant 
admettons cette fois que le choix de la commande soit basé sur l'information 
relative à la seule variable y. Adoptons comme commandes admissibles les com- 
mandes & = u (y) qui appartiennent à l’ensemble U donné 


u=u(y) EU 


De même que dans ce qui précède, ? = LI (x, y, u) est une fonction scalaire 
positive donnée. _ 
Soit min M! (x, y, u) le minimum de M! (x, y, u) sur l'ensemble des com- 


u(y 
mandes adrnissibles u = u (y) E U. Alors on a le lemme suivant. 
Lemme2.SoitM{:| y] l'espérance mathématique conditionnelle de y donné. 
Supposons que La fonction scalaire f (y, u) = M[l(zx, y, u) | y] possède un mi- 
nimum unique sur l'ensemble u € U pour tout y € Y. Soit u° (y) la valeur de u 
qui assure ce minimum. Alors 


. L(z, y, u)— Ml (z, y, u9 (y)) = 
u(y 
=M {min M{l(z, y,u)]yl}, (34.16) 
V 


où Le symbole M désigne l'espérance mathématique d'après la distribution de la 


] 
variable aléatoire y. . 
Démonstration du lemme. Par condition on a pour tout u € U 


f (y, u)> f(u, 0° (y))= min f(y, u). (34.17) 
Par suite, 
Mi(z, y, u)=Mf(y, u) =M/ (y, u0 (y))= 
pl 


—=Mi(z, y, w(y)=M{minM{l(z, y, u)]y]}. (34.18) 
7] u 
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En minimisant par rapport à u, où u € U, le premier membre de l'inégalité 
(18), on obtient 


min Ml(z, y, u) > Ml(z, y, u0(y)) = 
u(v) 
=M{minM{l(z, y, u)[y}}. (34.19) 
y s 


Puisque u0 (y) EU, on a l'inégalité 
Mi(z, y, u0(y)) > min Mix, y, u). (34.20) 
u(y) 


La comparaison des inégalités (19) et (20) conduit à la relation (15) 


minMi(z, y, u)=Ml(z, y, u0(y)=M{minM{l(z, y, u)|y]}. 
u(y) y  u 


Le lemme est démontré. 
Remarquons que l'opération min{[l(zx, y, u) | y] détermine u comme 


u 
fonction de y. Le lemme démontré affirme que le calcul de l'espérance mathé- 
matique d'après la distribution de la variable aléatoire y et la minimisation 
sur l’ensemble de u = u (y) € U sont des opérations commutatives. 
3°. Dans ce qui suit nous aurons besoin de la moyenne de la forme quadra- 
tique des variables aléatoires gaussiennes. A cet effet, on a le lemme suivant. 
Lemme 3. Soit x le vecteur aléatoire de dimension n et soit 


MI{z] = m, M{(z—m (z— m)*]=R. (34.21) 
Alors, pour toute matrice symétrique S de type n X n on a la relation 
M{z*Sz] = m*Sm + Sp [SR]. (34.22) 


Démonstration. Puisque 
M [z°Sz] = M[(z— m)* S(z— m)] + M{z*Sm] + M [m*Szx] — m*Sm, 
si l'on tient compte de M [x] = m, on obtient la relation 


M{z*Sz] = M[(z— m)* S(z— m)] + m*Sm. (34.23) 


Quels que soient les vecteurs a et b de dimension n et la matrice symétrique S 
de type nr X n on a l'identité 
a*Sb = Sp [Sab*], 
d'où l'on tire que 
(z— m)* S(z— m) = SpiS(z — m) (>: — m}*]. (34.24) 
Conformément à (24) 
Ml{(z— m)* S(z — m)] = Sp {MIS (z— m) (z — m)*]} = 
=Sp {S(M(z— m) (z— m)*]} = Sp[SRk (34.25) 
Les relations (25) et (23) entraînent la proposition (22) 
M {z*Sz] = m*Sm + Sp [SR]. 
Le lemme est démontré. 
Démonstration du théorème 1. En éliminant 


des relations (7) et (8) la matrice @ (4,) de type p X n on obtient 
que la matrice symétrique # (,) du type r X nr vérifie l'équation 
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aux différences 


V4 (£n) — O° (En+1 În) 4 (£n+1) O (En+1s ln) + Mn EE 
— D° (ny tn)  (En+1) L (En) [Tèn + L* (tn) Ÿ (En+1) L (En)? X 
XL*(t4,)Ÿ (tn+1) O (ln+1, tn) (54.26) 
et la condition à l'instant £\ 
S(tw)=F. (34.27) 
La relation (8) 
Ÿ (fn) ={O (tn41s Én) — L (tn) 8 (tn)]° P (En+1) X 
X [D (n+1s in) —Ltn) 8 (tn) + L° (tn) Pin (En) + Mn 


implique que si la matrice # ({,+,) est définie non négative, # (£,) 
est également une matrice définie non négative. 

Du fait que # est une matrice définie non négative, confor- 
mément à (27) # (£x) est également une matrice définie non néga- 
tive. De cette façon la matrice symétrique # ({,) du type n X n, 
0<n<N est une matrice définie non négative. 

Montrons maintenant que 

N=1 


2° (En) Fax (Ex) + 2 Er" (n) Mnz (En) + UN ur] = 
N-1 
= 2° (Lo) Ÿ (Lo) Z (to) + à [un + 8 (a) z (n)]* (L* (én) X 


N-1 
X Ÿ ({n+1) L (£n) + a] [un + & (ln) x ({n)] T 2 {unt"(ln) X 


X (£n+1) [D (En+1 ln) Z ({n) + L (En) Un] + 
+ [®O (én+1 tn) T (tn) + L (ln) Un] ÿ (£n+1) à (£n) Un + 
+ wir (3) Ÿ (ln+1) L (fn) Wan}. (34.28) 
La relation (28) peut être justifiée de la façon suivante. En 
vertu de (27) on a l'identité 
(IN) Fz(in)=z* (tx) P (tn) x (tx) = 


N—1 
mz® (to) Ÿ (to) + (to) + Ÿ Z° (tn4+1)Ÿ (tn+1) Z (tn+1) — 
dE N-1 
— So 2 (tn) P Un) 7 Un), 
n=- 0 


ou 
2 (IN) Fz(tx)=7* (to) Ÿ (to) z (to) + 


N—1 
+ 2 [T° (ns) P (tn+1) Z (tn+t)— 2 (ln) P (tn) ? (tn)]. (34.29) 
Tin 
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D'après l'équation (1), 
2° (tn+1) P (tn+1) T (tn+1) = 

7e [© (tn+1s tn) TZ (tn) + L (tn) un + Ti(tn) Wn]* SP (ta+1) X 

XI (tn+1» tn) Z (En) +L (En) un +T (tr) wnl. (34.30) 

D'après l'équation (8) 
&° (tn) Ÿ (tn) Z (tn) = 

= 2° (tn) (®* (En+as în) C4 (tn+1) © (tn+ts în) + Mn EE 

— B* (tn) (Rn + LS (tn) P (En+1) L (tn)] B (tn)}z (tn) (34 31) 


En portant les expressions (30) et (31) dans (29), on amène sans peine l'expres 
sion (29) à la forme (28) 


Notons que dans le cas où T(4,) = 0, l’expression (28) devient 


N—1 
2° (en) Fa (tx) + 2 [2° (En) Mnz (En) + Ur Inun] = 


N—1 
= 2 (bo) F (60) & (0) + À Lun + 8 (En)  (En)]° X 
X LL* (En) P (En) L'En) + Sn) Lun + & (En) (En). (34.32) 


Comme nous l'avons montré plus haut, la matrice symétrique 
S (t,) du typen Xn, 0<n< N, est définie non négative. C’est 
pourquoi le deuxième terme du second membre de l'expression (32) 
est non négatif. Comme il découle de l’équation aux différences (26), 
la matrice #(4,), 0L< nr L N ne dépend pas de la commande u, 
Ainsi, la relation (32) entraîne l'inégalité 


N—1 
2° (x) F x (x) + Pa [Z* (én) Max (fn) + UnRnun] > 


> z* (to) Ÿ (to) Z (Lo)s (34.33) 
le signe d'égalité de (33) n'ayant lieu que pour la commande 
Un (% =0, 1, ..., N — 1), déterminée par la formule (6): 

Un = Up = — B(tn) Z (tn). 


Ici la matrice # (f,) de type p X nr est définie par l'expres- 
sion (7); de plus, on suppose que la matrice .#”, qui fait partie de 
l'expression (7) 


Nan +L (in) #(Enss) Lin), n=0,1... N—1 (34.34) 


est définie positive. Le choix de la matrice , définie positive 
de type p X p dans la fonctionnelle (5) assure l’observation de cette 
contrainte. 
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Comme il s'ensuit de (33) et (22), dans le cas où l' (4) = 0, 
la valeur minimale de la fonctionnelle (5) est 


min J=MI{z* (to) Ÿ (to) x (to)l= 
= US (to) 1 +SpLS (£o) P (to). (34.35) 


Dans le cas général, où l (t,) 55 0, d’après (28), la fonction- 
nelle (5) devient 


N—1 
J=M{z" (in) Fz (tn) +2 [2° (En) Paz (n) + unRinun]} = 
N—-1 
= M{z°* (to) # (to) x (£o) + à DAT (én) S (n+1) L(£n) Wn + 


N-1 
+ 2 [un + & (in) 2 (n)]° [L° (En) Ÿ (En+1) X 
X L(tn) + Nn] {un + À (tn) z(tn)]}. (34.36) 
Conformément à (22) et compte tenu de M [w,] = 0, on a 


M {2° (to) Ÿ (to) z (éo)] = H°Ÿ (to) & + Sp LS (£o) P (é0)], 
M {ua (fn) Ÿ (tn+1) V (én) Wa] :- Sp IT* (45)  (En+1) L(£n) Qn]. (34.37) 


Ainsi, l'expression (36) devient 


1 


N— 
J'=M {at (ex) F7) + 2 (e* (En) Dos (En) + unten] = 
N—1 
— n° ÿ (to) H + Sp [Ÿ (£o) P (£o)] + 2 Sp ["° ({n) ÿ (£n+1) r (n) Qn] + 


N-1 
+MUZ Lun + (fn) & (En)1* LL* (En)  (En+1) L (En) + 


LE Nallun+S (én)z(th)l}. (34.38) 


D'une façon analogue à (33), la relation (38) entraîne l'inégalité 
suivante : 


N=1 
J=M{2" (in) F2 (tn) + à [2° (En) Mnz (fn) + urnun] > 
> ®Ÿ (lo) 4 + Sp(® (to) ? (£o)] + 
N—1 
+ Z SpIT*(En)# (ns:)T (En) Qni (34-39) 
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En outre, dans (39) le signe d'égalité n’a lieu que pour la commande 
Un (n — 0, 1, ..., N — 1) définie par la formule (6) 


Un = Un = — B(th) x (tn), 


où la matrice & (4) d'ordre p X n est définie par l’expression (7). 
Ici, de même que précédemment (34), on observe la condition 


SN'n=Nn+L'(tn)Ÿ (fn) L(tn)>0, n—=0,1,...,N—1, (34.40) 


c'est-à-dire la condition d’une matrice .f', définie positive. 

D'après (39), la valeur minimale de la fonctionnelle (5) est 
déterminée par l'expression (10). Le théorème est démontré. 

2. Systèmes linéaires à critère quadratique de performance avec 
information incomplète sur l'état du système. Théorème de sépa- 
ration. 

Considérons le système décrit par l'équation vectorielle aux 
différences finies 


T (n+1) = (én+1 ln) z (tn) + L (fn) Un + F ({n) Un 
n=0,1;:2,:2::. 2Z(L) =<. (34.41) 


Ici x est le vecteur d'état de dimension n; ® (f,+4,, {h), la matrice 
n Xn; Li(t,), la matrice n X p; u,, le vecteur de commande de 
dimension p; L'(£4,), la matrice nr X r; w,, la suite vectorielle de 
dimension r des variables aléatoires gaussiennes réciproquement 
indépendantes à moyenne nulle. 
Les mesures permettent de déterminer le vecteur z, de dimension 
m, n = 0, 1, 2, ..., défini par la relation 
Zn = H,z (ln) + Ua, n—0; 14 2: (34.42) 
où H, est la matrice m X n; v,, la suite vectorielle de dimension m 
des variables aléatoires gaussiennes réciproquement indépendantes 
à moyenne nulle. La mesure directe de z ({,) est supposée impossible. 


Les matrices de corrélation des suites discontinues w, et vw, 
sont de la forme 


M lwui] = Qnônn 
M [oui] = Rhôhn; (34.43) 
Mlw,vi] = 0, 
où @, est la matrice symétrique définie non négative r X r, et R;, 
la matrice symétrique définie positive m X m ; par ailleurs, R, > &E£, 


où &« > 0 et E est la matrice unité. 
Ô,r désigne le symbole de Kronecker 


4 pour n=K, 


= À pour nÆk. 
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Par s on désigne le vecteur aléatoire gaussien de dimension 
n à valeur moyenne 


Mis =u (34.44) 
et à matrice de corrélation 
M {(s — p) (s — u)*] = P (to). (34.45) 


Ici P (t,) est la matrice définie non négative de type rn X n qu'on 
suppose connue. De plus, on suppose que w (1), v (t) et s sont non 
corrélés et, par conséquent, indépendants. 

Par x (t, | j) on désigne l’espérance mathématique conditionnelle 
de z(f,) avec Zo, Z1» + - -, 2j donnés: 


zftnlj)=Mz(t)|Zos 21 -.. 2j], 


D (54.46) 
z(tn|n) Mr) | 20 Zi 2n se 20) 
De plus, introduisons les notations 
Z (fn | j)= 7 (En) —Z (En | j), (34.47) 
P(taln)=M{z(|n) 2° (tn|n)], (34.48) 


P(taln—1)=Miz(tnln—1) z°(tnln—1)]. (34.49) 

De même qu’au point 1, considérons le problème de régulation 

de l’état du système, c’est-à-dire celui dans lequel le but de la com- 
mande est de maintenir les moyennes des coordonnées de phase 
zy (t) dans le voisinage du zéro. Considérons que l'intervalle de 
temps (ts, tn) dans lequel on réalise la commande est fixé. Ainsi, 
de même qu'au point 1, la commande u,, nr = 0,1,..., N —1 
(où W est fixé) doit être choisie de façon à minimiser la fonctionnelle 


N—1 
JM {tn Fr (+ D Un) Dar (bn) + (uns run). 
(34.50) 


Ici 4 et Y, sont des matrices symétriques définies non négatives 
de type n X n, et %,, la matrice symétrique définie positive de 
type P X p. 

En posant que les commandes admissibles u, sont des fonctions 
de Zos 21» -+ + +» Z2n-1 €t fn, désignons par u° la commande optimale, 
c'est-à-dire la commande minimisant la fonctionnelle (50). 


Théorème 2. Dans le problème à extrémité libre de la trajec- 
toire et à temps fixé (41), (42), (50), avec une information incomplète 
sur l'état du système, la commande optimale u° s'écrit 


= — B(tr)z(tnln—1). (34.51) 
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Ici z(t, | — 1) est déterminée par les relations récurrentes 


TZ (tn41] 7) = © (tnsis n) Zn |) + L (tn) u9, (34.52) 
Ztn|n)=z(talr—1)+ Anfzn—Haz(tn|n—1)], 
| Z(tol—1)=Z()=m (34.53) 
ou 
An= P(taln—1) Hi{HaP (tnlnr—1) 4%+ Raj, (34.54) 
P (nur) = © (En+1s În) P (tn |) D" (En+ts Én) + 
+ T (En) QnT* (én), (34.55) 
P(tn|r)=(E—AnHn)P (tnln—1)(E—AnHn)" + 
+ AnRnAË = P (tnln—1)—AnHnP (énln—1), (34.56) 
P (tol—1)=P (to) =M{(s—u)(s—u)"*]. 


Les relations récurrentes (52) et (53) sont équivalentes à l'équation 
vectorielle aux différences 


Z (éns11 7) = © (énsss fn) Z (fn| 7 —1) + 
+ L (tn) Un + ® (én+1 În) P (in | n — 1) X 
X H3 [#, P (ln n— 1) Hi + Ra] [2n — Hnt (ln n—1)], (34.57) 
z(tol—1)=2(t0)=b. 
La matrice & (t,) de type p X n qui fait partie de la formule (51) 
est de la forme 
PB (tn) =[Xn + L° (En) Ÿ (En+1) L (En)? X 
X L* (tn) # (tn+3) D (Ën+1s n) (34.58) 


où la matrice # (t,) de type n X n est définie par la relation de 
récurrence 
C4 (£n) = O° (En+1 tn) Ÿ (Ën+1) O (En+1 ln) + 
+ Mn — P° (ln) [Na + L° (En) P (En+1) L (En) (tn) = 
= (D (énsis tn) —L (tn) B (tn)}° Ÿ (En+1) D (En+1s tn) + Mn = 
= [D (fn41, tn) — L (tn)  (En)}° P (En+1) [D (En+1, {n) — L (tn) & (fn)] + 
+ B° (tn) NnP (tn) + Mn (34.59) 


et par la condition à l'instant tx 


P(In)=F. (34.60) 
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La valeur minimale de la fonctionnelle (50) s'écrit 
min J=u*® (to) L +Sp[® (to) P (to)] + 


N-1 
+ 2 Sp [T° (fn) # (tn+1) L'(Ën) Qnl + 


N—1 
+ 2 SP [P (fn [n—1) 8° (t) L° (tn) Ÿ (£n+1) D (én+13 fn)]. (34.61) 


Démonstration du théorème 2. Comme nous 
l'avons dit plus haut, la mesure directe de l’état du système étant 
impossible, on adopte comme commandes admissibles w, les fonc- 
tions de 20, 21, + - ., Zn-1» fn- Puisque les équations (1), (7), (8) 
et (9) qui ont lieu dans le problème à information complète sur 
l'état du système coïncident respectivement avec les équations (41), 
(58), (59) et (60), les expressions (28) et (38) sont également valables 
pour le problème à information incomplète sur l’état du système. 

Toutefois, puisque la commande définie par la formule (6) n’appar- 
tient pas au nombre de commandes admissibles du problème avec 
information incomplète, le dernier terme de l'expression (38) 


N—1 
J,=M| 2 Lun + & (fn) x (én)]* [L* (En)  (tn+1) L (En) + Rn] X 


X [un + @ (ln) x ({n)]} (34.62) 
est maintenant différent du zéro. 
En appliquant le lemme 2 à la fonction (62), on obtient confor- 
mément à (16) 


N—1 
min M { 2 [un + © (én) 2 (én)]" [L* (tn) S (tn+1) L (tn) + Jen] X 


N—1 
X [un + & (Ën) z (fn)]} =M(minM | pr [un +8 (ln) x (n)]* X 
X [L* (En) # (tn+1) L (tn) + n, fu + (tn) (fn)]|Sn1}) (84.63) 


où 8h - est le vecteur dont les éléments sont des vecteurs 2,, z, . . . 
ss ne 

Ici M {-| 3,-,} désigne l’espérance mathématique conditionnelle 

pour &,-, donné, c'est-à-dire pour Zo, Z1, + - -» Z2n-y donnés. La 


minimisation par rapport à u, se fait sur l’ensemble des commandes 
u, qui sont des fonctions de 25; 21, + « +; 2n-1. Le symbole M désigne 
# F3 


l'espérance matématique d’après la distribution commune des 
variables aléatoires 20, Z1, .. ., Zn 
Compte tenu des notations introduites dans (46) et (49), 


M{z(tn)| Zos Zi es 2n11=Z(tnln—1), 
COV[Z (ln) | 20 Z19 ++» 2n-1]=P(inlr—1), 
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on a en vertu du lemme 3 la relation 


N-1 
M| pr [un + 8 (tn) z (n)]° [L* (En) Ÿ (Ën+1) L (En) + 
. + Ra] [un + P (tn) 2 (4n)]| ns) = 
— 1 
= Sp{&* (tn) [L* (ln) # (tn+1) L (tn) + Ven] À (fn) P (nr —1)} + 


Ni 


+ lun +8 (6n) 2 (En | r—1))% LL* (En) F (En) L (En) + 
+ Ra] lun +8 (in) Z(nlr—1)]. (34.64) 


Les relations récurrentes (55) et (56) montrent que la matrice 
de corrélation P({,| nr — 1) est indépendante de u. Ainsi, comme 
il résulte de (64) et (63), la commande optimale u! est déterminée 
par la formule (51): 


uo= —  (tn)z(tn|n—1). (34.65) 


Comme il s'ensuit de (38), (63), (64) et (65), la valeur minimale 
de la fonctionnelle (50) est 


min J=u"# (to) +Sp[S (to) P (to)] + 


N-1 
+ À SpIT* (En) # (En41) (En) Qn] + 


N-1 
ga ni Sp[P (tn|n—1) 8° (tn) [L* (En) P (En+1) L (tn) + Rn] À (tn). 
(34.66) 


En remplaçant la matrice # ({,) par l'expression (58), on ramène 
la formule (66) à la forme (61). 

Les relations (52) à (56) données dans le théorème pour u,= 0 
sont déduites au $ 31. Au $ 33 (théorème 1), on a étudié le cas où 
u, = 0. Le théorème est démontré 


on D [JO © — 
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